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内 容 提要 


本 书 从 一 位 虚拟 机 (VM) 架构 师 的 角度 ， 以 易于 理解 、 层 层 深入 的 方式 介绍 了 各 种 主题 和 算法 ， 尤 
其 是 不 同 VM 通用 的 主要 技术 。 这 些 算法 用 图 示 充 分 解释 ， 用 便于 理解 的 代码 片段 实现 ， 使 得 这 些 抽象 概 
念 对 系统 软件 工程 师 而 言 具 像 化 并 可 编程 。 书 中 还 包括 一 些 同类 文献 中 较 少 涉及 的 主题 , 例如 运行 时 辅助 、 
栈 展开 和 本 地 接口 。 本 书 集 理论 性 与 实践 性 于 一 身 ， 不 仅 结合 了 高 层 设 计 功 能 与 底层 实现 ， 而 且 还 结合 了 
高 级 主题 与 商业 解决 方案 ， 是 VM 设计 和 工程 实践 方面 的 理想 参考 读物 。 

本 书 适 合 对 虚拟 机 感 兴趣 的 软件 开发 者 及 研究 人 员 阅 读 。 
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亲爱 的 读者 : 

你 现在 看 到 的 这 本 书 讨论 的 是 语言 虚拟 机 的 设计 与 实现 技术 。 虚拟 机 这 个 概念 的 内 涵 在 过 去 
十 几 年 里 逐渐 发 生 了 变化 ,从 特 指 实现 某 个 语言 的 运行 时 技术 , 扩大 到 系统 仿真 的 各 类 技术 ， 甚 
至 容器 技术 。 其 中 一 个 原因 是 , 语言 虚拟 机 已 经 被 广泛 应 用 在 各 个 领域 , 并 与 各 种 系统 紧密 结合 ， 
从 而 不 再 新 奇 和 稀有 。 如 果 现 在 的 程序 员 在 平时 的 工作 中 接触 不 到 某 种 语言 的 虚拟 机 , 那 倒是 比 
较 少 见 了 。 尽管 如 此 ， 语 言 虚拟 机 的 设计 技术 对 大 多 数 人 来 说 ,仍然 深 不 可 测 。 昌 然 市 场 上 已 经 
有 了 一 些 相 关 图 书 ， 网 络 上 的 各 种 文章 也 层出不穷 , 但 现 有 的 资料 要 么 偏 于 理论 和 概念 ,要 么 仅 
限于 讨论 语言 虚拟 机 的 某 个 局 部 , 很 难 让 学 习 者 对 语言 虚拟 机 技术 有 全 面 而 系统 的 理解 。 学 习 者 
往往 还 要 通过 阅读 某 个 虚拟 机 的 源码 来 学 习 相 关 技 术 ， 但 因为 并 不 了 解 其 设计 决策 的 来 龙 去 脉 ， 
所 以 在 想 改进 一 个 虚拟 机 或 者 开发 自己 的 虚拟 机 项 目 时 ， 仍 会 感到 力不从心 。 

笔者 多 年 来 一 直 从 事 虚 拟 机 技术 的 研究 与 开发 ,同时 也 大 量 涉猎 操作 系统 、 编 译 器 和 语言 设 
计 的 相关 技术 。 由 本 人 及 所 带领 团队 开发 的 各 类 虚拟 机 软件 和 技术 已 经 被 应 用 在 数 以 亿 计 的 服务 
器、 个 人 计算 机 、 手 机 和 其 他 智能 设备 中 , 一 些 创 新 研究 成 果 以 学 术 论文 的 形式 发 表 在 著名 的 国 
际会 议 上 。 在 这 个 过 程 中 , 笔者 对 虚拟 机 设计 的 特点 有 了 较 深 的 理解 ,经 常 受 邀 给 一 些 研究 和 开 
发 机 构 做 报告 或 培训 , 并 先后 为 北京 大 学 和 中 国 科技 大 学 计算 机 系 的 研究 生 讲授 过 短期 课程 。 笔 
者 的 一 些 博客 文章 ， 一 度 在 Google 搜索 相关 技术 时 排名 居 前 ， 给 业界 同行 带 来 了 有 益 的 启发 。 
在 和 同行 的 交流 中 , 笔者 也 往往 会 得 到 一 些 精彩 的 反馈 ， 加深 了 自己 对 该 领域 的 理解 ， 并 在 项 目 
中 得 以 实践 。 这样, 经 过 反复 的 “研发 实践 -提炼 总 结 - 交 流 反 馈 - 吸 收 改 进 "， 笔 者 对 虚拟 机 的 技 
术 逐 步 形 成 了 一 套 较为 系统 的 设计 方法 论 。 这 些 心得 体会 , 在 现 有 的 技术 资料 中 很 难 找 到 较 完整 
的 表述 ,因此 一 些 同 事 和 朋友 还 是 会 经 常 向 我 咨询 相关 问题 ， 并 建议 我 能 整理 成 文字 ,给 相关 开 
发 人 员 提 供 帮 助 ， 并 填补 虚拟 机 技术 文献 的 空白 。 这 就 是 我 写 这 本 书 的 初衷。 

把 多 年 的 知识 积累 系统 地 写 出 来 ,并 做 到 深入 浅 出 ,这 不 是 一 件 容易 的 事 。 由 于 笔者 所 从 事 
的 工作 的 特点 ， 业余 时 间 不 是 在 加 班 ， 就 是 在 学 习 充电 , 并 且 经 常 出 差 . 这 样 的 情况 下 要 保障 每 
天 写 书 一 小 时 ， 而 且 内 容 前 后 保持 连贯 、 环 环 相 扣 ， 是 需要 极 大 的 角力 的 。 从 动笔 开始 ， 前 前 后 
后 写 了 近 四 年 才 搁 笔 。 当 然 , 写作 期 间 也 有 不 少 乐趣 ,特别 是 每 当 自 己 精心 绘制 出 一 幅 图 ,将 语 
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言 难以 表达 的 意思 较 好 地 表达 出 来 时 ， 总 会 端详 片刻 ,体验 一 下 表达 的 乐趣 。 但 总 体 来 说 ,遗憾 
比 快乐 更 多 。 这么 说 的 一 个 重要 原因 是 , 尽管 用 时 颇 长 , 但 本 来 计划 好 的 内 容 还 是 有 很 大 一 部 分 
因 种 种 原因 未 能 写成 ,只 能 留待 未 来 弥补 了 。 好 在 成 书 的 部 分 已 经 相对 完整 ， 基 本 概括 了 典型 的 
语言 虚拟 机 的 所 有 核心 部 件 的 设计 。 对 学 习 者 来 说 ， 如 果 掌 握 了 这 些 内 容 , 那么 对 虚拟 机 技术 的 
理解 就 已 经 相当 深入 了 ,足以 支撑 其 进入 任意 一 种 语言 虚拟 机 的 设计 开发 。 不 过 需要 提醒 的 是 ， 
本 书 对 读者 的 系统 软件 基础 有 一 定 的 要 求 , 即 了 解 基本 的 编译 器 和 操作 系统 技术 。 在 遇 到 生 玻 的 
术语 时 ， 请 查阅 相关 资料 。 

本 书 有 两 个 特点 : 一 是 比较 系统 全 面 , 很 多 内 容 在 其 他 资料 中 难以 见 到 ， 比 如 异常 处 理 的 实 
现 等 ; 二 是 内 容 尽 量 做 到 深入 浅 出 ， 既 有 理论 阐述 ， 又 有 代码 示例 。 笔 者 尽力 将 典型 虚拟 机 设计 
的 方方面面 都 有 机 地 串联 在 一 起 ,并 解释 它们 的 来 龙 去 脉 ， 而 不 是 简单 地 进行 技术 堆砌 。 对 每 个 
主题 的 内 容 ， 本 书 也 尽量 按照 平常 的 思维 模式 ,循序 渐进 地 讲解 。 不 过 请 读者 注意 ， 本 书 的 重点 
是 虚拟 机 中 特有 的 技术 ,如果 某 种 技术 在 编译 器 或 操作 系统 中 已 经 有 充分 的 讨论 , 本 书 则 会 略 去 。 
读者 如 果 对 那些 技术 感 兴 趣 ， 应 能 找到 比 本 书 更 好 的 资料 。 男 外 ， 本 书 内 容 虽 然 是 虚拟 机 通用 技 
术 为 主 , 但 为 了 避免 泛泛 而 谈 ， 主 要 以 JVM 设计 为 例 ， 并 兼顾 其 他 虚拟 机 。 还 有 ， 近 几 年 来 ， 
语言 虚拟 机 设计 技术 又 有 了 新 的 发 展 ， 比 如 异步 编程 ,但 本 书 没有 涵盖 ,请 读者 海 涵 。 读 者 奉 有 
任何 对 本 书 内 容 的 批评 和 建议 ,请 与 我 联系 ， 不 胜 荣幸 ! 

最 后 ， 感 谢 我 的 老 朋 友 、 著 名 编译 专家 周志 德 ( Fred Chow ) 欣然 为 本 书 作 序 ， 同 时 感谢 
译 者 单 业 和 图 灵 编 辑 团队 对 本 书 的 出 版 所 做 的 重要 贡献 。 在 我 与 图 灵 出 版 团队 的 交往 中 , 我 深切 
感受 到 他 们 对 图 书 质量 的 严格 要 求 和 对 读者 的 诚挚 与 负责 。 和 希望 本 书 能 为 图 灵 的 精品 书 单 增添 
光彩 。 


李晓峰 
2019 年 11 月 1 日 于 美国 硅谷 
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传统 上 , 一 个 计算 系统 建立 在 支持 操作 系统 的 硬件 平台 之 上 , 应 用 程序 在 操作 系统 中 以 硬件 
执行 的 机 器 指令 形式 运行 。 随 着 编程 语言 的 发 展 , 程序 员 已 经 开始 感恩 动态 或 托管 语言 在 提升 编 
程 效 率 方面 的 优势 。 通 过 提供 更 好 的 安全 性 和 软件 可 移植 性 ， 虚 拟 机 ( VM ) 现 已 成 为 更 适合 软 
件 程序 的 执行 环境 。 目 前 最 先进 的 VM 设计 代表 了 过 去 几 十 年 的 研究 及 开发 活动 的 成 果 。 这些 工 
作 大 体 上 致力 于 改进 VM 在 功能 和 性 能 方面 的 实现 。 随 着 时 间 积 累 , 当前 产品 级 质量 的 VM 已 经 
变 得 非常 复杂 ， 并 且 通 常 要 耗费 巨大 的 精力 来 实现 。 即 使 对 经 验 丰 富 的 软件 工程 师 来 说 ， 理 解 
VM 如 何 工 作 也 成 为 了 一 项 挑战 。 


从 李晓峰 任职 于 Intel 公司 开始 , 我 和 他 相识 已 经 超过 15 年 了 。 他 带领 开发 了 Intel 平 台 上 的 
多 个 编译 器 和 托管 运行 时 系统 。 李 晓 峰 是 Apache Harmony MAP JVM 的 主要 贡献 者 。 他 还 在 
Perl, Ruby, JavaScript 以 及 Android 相关 的 VM 设计 方面 做 了 大 量 的 研究 工作 。 李 晓 峰 在 VM T 
程 和 产品 方面 拥有 丰富 的 经 验 , 这 使 他 对 VM 设计 的 不 同 领域 都 有 实质 性 的 见解 , 而 这 又 让 他 拥 
有 独特 的 视角 ， 能 够 在 本 书 中 探讨 与 VM 相关 的 诸多 话题 。 

作为 研究 者 和 工程 师 , 李晓峰 从 系统 架构 师 的 独特 视角 撰写 了 本 书 。 他 强调 工程 实践 中 应 考 
虑 的 因素 ， 并 关注 各 种 组 件 之 间 的 交互 及 合作 方式 ， 及 其 给 接口 层 设计 带 来 的 影响 。 其 他 关于 
VM 的 书 中 通常 很 少 讨论 这 些 细节 。 本 书 还 提供 了 详细 的 图 示 和 代码 片段 ， 清 晰 地 阐释 了 书 中 的 
观点 。 关 于 VM 设计 与 实现 的 高 级 主题 , 本 书 已 经 成 为 了 我 不 可 或 缺 的 参考 书 。 我 向 系统 软件 开 
发 者 ， 尤 其 是 托管 运行 时 系统 的 开发 者 ， 强 烈 推荐 本 书 ， 因 为 本 书 能 够 清晰 地 解答 他 们 在 探索 
VM 相关 话题 时 所 产生 的 疑问 。 


李晓峰 完成 了 这 部 关于 VM 的 专著 ,在 VM 设计 和 工程 实践 方面 做 出 了 巨大 的 贡献 。 


司 志 德 (Fred Chow ) 


Futurewei Technologies 首席 科学 家 
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本 书 的 主题 是 为 Java 和 JavaScript 这 样 的 编程 语言 设计 和 实现 虚拟 机 。 

虚拟 机 (VM ), 也 称 为 托管 运行 时 系统 , 或 者 托管 运行 环境 。 它 还 有 一 个 更 通俗 的 名 字 一 一 
沙 盒 技术 。 自 几 十 年 前 被 发 明 以 来 ，VM 一 直 吸 引 着 软件 研究 人 员 和 开发 者 的 兴趣 和 关注 。 这 是 
因为 VM 为 软件 带 来 了 重要 属性 ， 比 如 安全 性 、 高 生产 率 和 可 移植 性 。 在 当今 的 计算 系统 中 ， 





VM 已 经 变 得 无 处 不 在 一 一 从 物 联网 (Internet of Things, IoT) 节点 到 移动 电话 、 个 人 计算 机 ， 
再 到 云 平台 。 


我 的 许多 从 事 软 件 相关 工作 的 朋友 都 乐于 学 习 VM 的 知识 。 他 们 经 常 向 我 咨询 他 们 在 日 常 工 
作 中 使 用 的 VM 的 相关 问题 。 我 发 现 这 些 问 题 很 多 都 和 VM 中 的 常用 技术 有 关 , 但 他 们 很 难 从 现 
有 的 图 书 和 其 他 文档 中 找到 有 用 信息 。 究 其 原因 ， 这些 资料 要 么 主要 关注 规范 和 原则 ,要 么 是 人 研 
究 论 文 ， 过 于 学 术 化 。 当 我 的 朋友 Ruijun He 一 一 Taylor & Francis 出 版 集团 的 编辑 一 一 邀请 我 撰 
写 VM 主题 的 书 时 ， 我 觉得 专门 为 有 兴趣 探索 VM 工作 机 制 的 软件 开发 者 写本 书 是 一 个 好 主意 。 

我 曾 应 邀 在 高 校 和 公司 做 关于 VM 的 讲座 。 这 些 讲座 笔记 逐渐 累积 , 似乎 可 以 成 书 了 。 我 曾 
以 为 把 它们 整理 成 书 应 该 很 容易 , 但 实际 情况 是 ， 当 我 试图 用 系统 化 和 条 理化 的 方式 组 织 这 些 材 
料 ， 并 辅 之 以 深刻 的 理论 文 持 与 实用 的 代码 片段 时 ， 才 发 现 这 是 一 项 艰巨 的 挑战 。 

我 尽力 让 本 书 有 别 于 类 似 主题 的 已 有 文献 。 因 此 , 我 从 VM 架构 师 的 角度 来 组 织 内容 ， 尝试 
用 整体 方法 来 设计 VM。 本 书 大 部 分 内 容 在 2014 年 年 底 前 完成 。 从 那 之 后 ， 我 一 直 关 注 着 业界 
VM 的 新 发 展 。 不 过 本 书 并 不 打算 面面俱到 地 讨论 各 种 VM 实现 , 而 是 专注 于 不 同 YM 通用 的 那 
些 最 重要 的 技术 。 我 非常 乐意 根据 读者 的 反馈 来 改进 和 调整 本 书 的 内 容 。 若 对 本 书 有 任何 评论 ， 
可 以 反馈 给 本 书 出 版 社 ， 或 发 邮件 给 本 书 作者 : li@xiaofeng.info。 


李晓峰 


D 本 书 中 文 版 勘误 可 以 到 图 灵 社 区 页 面 ( http://www. ituring.com.cn/book/2600 ) 提交 。 一 一 编者 注 
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随 着 运行 时 引擎 的 地 位 越发 重要 ， 并 在 日 常 计算 系统 中 变 得 无 处 不 在 ， 软 件 社区 对 现代 虚 
拟 机 设计 和 实现 的 详尽 解释 产生 了 强烈 的 需求 ， 包 括 Java 虚拟 机 (JVM )、JavaScript 引擎 和 
Android 执行 引擎 。 社 区 和 希望 看 到 的 不 止 是 形式 化 的 算法 描述 ， 还 有 实用 的 代码 片段 。 社 区 希望 
理解 的 不 止 是 研究 课题 , 还 有 工程 上 的 解决 方案 。 本 书 以 独特 的 论述 方式 , 结合 了 高 层 设计 功能 
与 底层 实现 ， 同 时 也 结合 了 高 级 主题 与 商业 解决 方案 ,希望 以 此 来 满足 上 述 需 求 。 

本 书 采 用 整体 方法 来 介绍 VM 体系 结构 的 设计 , 将 内 容 组 织 为 一 致 的 框架 ， 以 易于 理解 、 层 
层 深 入 的 方式 介绍 了 各 种 主题 和 算法 。 它 关注 VM 设计 的 关键 方面 , 而 这 些 在 其 他 书 中 通常 是 被 
忽略 的 ， 比 如 运行 时 辅助 、 栈 展开 和 本 地 接口 。 这 些 算法 用 图 示 充 分 展示 ， 用 便于 理解 的 代码 片 
段 实现 ， 使 得 这 些 抽象 概念 对 系统 软件 工程 师 而 言 具 像 化 并 可 编程 。 
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本 章 介 绍 虚 拟 机 的 概念 ,虚拟 机 已 经 以 各 种 形式 发 展 了 数 十 年 ,1995 年 ,Sun 公司 发 布 了 Java 
编程 语言 以 及 相应 的 Java 虚拟 机 (JVM )， 由 此 虚拟 机 开始 为 普通 开发 者 所 知 。 


1.1 虚拟 机 类 型 


虚拟 机 是 一 个 计算 系统 ,计算 系统 的 最 终 目标 是 执行 预先 编程 的 逻辑 。 这 些 逻 辑 可 以 以 非常 
底层 的 形式 表达 , 包含 了 实际 计算 机 的 所 有 细节 ; 也 可 以 通过 脚本 或 标记 语言 在 很 高 的 层次 上 表 
达 。 从 这 个 角度 看 ， 根 据 抽象 层次 和 模拟 范围 ， 可 以 把 虚拟 机 大 致 分 为 如 下 4 种 类 型 。 
O 类 型 1， 完 整 指令 集 架 构 〈ISA) 虚拟 机 ， 提 供 完整 的 计算 机 系统 ISA 模拟 或 虚拟 化 。 客 
户 操作 系统 和 应 用 程序 在 这 个 虚拟 机 上 可 以 像 在 实际 计算 机 上 那样 运行 (例如 
VirtualBox, QEMU 和 XEN ) . 
O 类 型 2， 应 用 程序 二 进 制 接口 (ABI) 虚拟 机 ， 提 供 客户 进程 ABI 模 拟 。 针 对 这 套 ABI AY 
应 用 程序 ， 可 以 在 这 个 进程 中 与 其 他 本 地 ABI 应 用 程序 进程 并 肩 运 行 【 例如 安 腾 处 理 器 上 
的 Intel IA-32 Execution Layer ( IA-32 执行 层 ) 、Transmeta 提供 X86 模拟 的 Code Morphing, 
以 及 Apple 的 用 于 模拟 PowerPC 的 Rosetta 转译 层 ] 。 
O 类 型 3， 虚 拟 ISA 虚拟 机 ， 提 供 一 个 运行 时 引擎 ， 以 便 虚拟 ISA 编码 的 应 用 程序 在 其 上 执 
行 。 虚 拟 ISA 通常 定义 了 一 套 高 层 的 、 规 模 有 限 的 ISA 语义 ， 所 以 不 需要 虚拟 机 模拟 完 
整 的 计算 机 系统 [ 例如 Sun Microsystems 的 JVM, Microsoft 的 通用 语言 运行 时 ( Common 
Language Runtime ) ,以 及 Parrot Foundation 的 ParrotVM | 。 
口 类 型 4， 语 言 虚 拟 机 ， 提 供 一 个 运行 时 引擎 来 执行 以 客户 语言 编写 的 程序 。 程 序 通常 以 客 
户 语 言 的 源码 形式 提供 给 虚拟 机 ， 并 没有 预先 完全 编译 为 机 器 码 。 运 行 时 引擎 需要 解释 
或 翻译 程序 ， 还 要 实现 一 些 像 内 存 管理 这 样 的 由 语言 抽象 出 的 功能 (例如 Basic, Lisp, 
Tel 和 Ruby 的 运行 时 引擎 ) 。 
上 述 几 种 虚拟 机 类 型 的 边界 并 不 是 完全 清晰 的 。 许 多 虚拟 机 的 设计 跨越 了 边界 。 例 如 ， 某 个 
语言 虚拟 机 可 以 把 程序 编译 为 某 种 虚拟 ISA, 然后 在 这 个 虚拟 ISA 的 虚拟 机 上 执行 ,这 样 就 利用 
了 虚拟 ISA 虚拟 机 技术 。 即 便 如 此 ， 为 虚拟 机 分 类 以 便于 社区 交流 仍 是 有 意义 的 。 


前 两 种 虚拟 机 类 型 分 别 是 ISA 模拟 和 ABI 模拟 。 它 们 的 目标 是 在 主机 上 运行 为 非 本 地 ISA 
或 ABI 开 发 的 现 有 客户 操作 系统 或 客户 应 用 程序 。 它 们 有 时 也 被 称 为 模拟 器 。 

另外 两 种 虚拟 机 是 语言 运行 时 引擎 ， 其 目标 是 执行 以 虚拟 ISA 或 客户 语言 形式 编写 的 逻辑 。 
在 某 些 上 下 文中 , 虚拟 ISA 也 被 看 作 一 种 特殊 的 语言 ; 除 此 之 外 ,这 两 种 语言 运行 时 引擎 并 没有 
本 质 上 的 区 别 。 

本 书 的 主题 是 语言 运行 时 引擎 。 除 非特 别 指出 ， 和 否则 后 面 章节 中 的 关键 词 “ 虚 拟 机 ”只 表示 
语言 运行 时 引擎 ， 并 且 “ 运 行 时 引擎 ”和 “虚拟 机 ”可 以 互 换 使 用 。 使 用 “运行 时 引擎 ”这 种 表 
达 是 因为 虚拟 机 提供 的 服务 多 数 只 在 运行 时 可 用 。 相 比 之 下 ,在 “编译 吉 + 操作 系统 ”这 套 传 统 
配置 中 ,应 用 程序 由 编译 器 静态 编译 之 后 发 布 。 出 于 同样 的 原因 ， 有 些 人 使 用 “运行 时 系统 ”来 
指 代 运 行 时 可 用 的 、 让 软件 能 够 执行 的 服务 。 


1.2 为 什么 需要 虚拟 机 


虚拟 机 是 现代 编程 不 可 或 缺 的 技术 。 虚 拟 机 改善 了 《计算 机 ) 安全 性 、( 编程 ) 效率 和 ( 应 
用 程序 ) 可 移植 性 。 


对 安全 语言 来 说 ， 虚 拟 机 是 必要 的 。 这 里 安全 语言 ( safe language ) 是 一 个 非常 宽泛 的 概念 ， 
主要 指 提供 了 内 存 安全 、 运 算 安 全 和 控制 安全 特性 的 语言 。 通 过 安全 语言 , 能 尽早 安全 地 捕获 程 
序 bug 或 运行 错误 。 
(1) 内 存 安 全 确保 内 存 中 某 种 类 型 的 数据 总 是 遵循 对 这 种 类 型 的 限制 。 例 如 ， 指 针 变 量 永远 
不 会 持 有 非法 指针 ， 数 组 元 素 永远 不 会 越界 。 

(2) 运算 安全 确保 对 某 种 类 型 数据 的 运算 总 是 遵循 对 这 种 类 型 的 限制 。 例 如 ， 指 针 变 量 不 允 
许 进行 任意 算术 运算 。 

(3) 控制 安全 确保 代码 执行 流 既 不 会 卡 住 也 不 会 跑 飞 ( 例如 跳 转 到 恶意 代码 段 ),。 控制 安全 也 
可 以 被 看 作 某 种 特殊 的 运算 安全 。 

几乎 所 有 的 现代 编程 语言 都 是 安全 语言 ， 例 如 Java、C#、Java 字 节 码 、Microsoft 中 间 语 言 
( Microsoft Intermediate Language ) 以 及 JavaScript， 尽 管 它们 各 自 的 安全 程度 有 所 不 同 。 

要 支持 安全 语言 ， 虚 拟 机 往往 是 必要 的 ,因为 安全 语言 本 身 并 不 能 满足 所 有 的 安全 需求 。 例 
如 , 程序 不 应 该 直接 分 配 一 块 没有 类 型 的 内 存 。 它 需要 虚拟 机 来 为 它 提供 带 类 型 的 内 存 , 例如 某 
种 类 型 的 对 象 。 如 果 没 有 虚拟 机 ， 那 么 安全 语言 必须 引入 非 安 全 的 操作 支持 ， 比 如 Rust 语 言 。 

虚拟 机 为 安全 语言 的 代码 和 数据 提供 “托管 ?>。 因 此 ， 这 些 代码 和 数据 有 时 被 称 为 “托管 代 
码 ” 和 “托管 数据 *”。 相 应 地 ， 虚拟 机 有 时 也 被 称 为 “托管 运行 时 ”“ 托 管 系统 ”或 者 “托管 执行 
环境 ”。 

因为 用 安全 语言 编写 的 程序 更 加 难以 被 恶意 代码 攻击 , 所 以 在 安全 沙 盒 技 术 中 有 时 会 利用 虚 
拟 机 。Google Chrome NaCl 技 术 就 是 一 个 例子 。 
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因为 安全 语言 能 够 在 编译 时 或 运行 时 尽早 安全 地 捕获 程序 中 的 bug， 所 以 显著 提高 了 开发 者 
的 生产 率 。 

虚拟 机 对 可 移植 性 的 改善 是 指 ,虚拟 ISA 或 者 客户 语言 并 没有 绑 定 到 任何 特定 的 本 地 ISA 或 
ABI 定 义 上 。 虚拟 ISA 中 的 应 用 程序 可 以 在 任意 部 署 了 相应 虚拟 机 的 系统 上 运行 。 可 移植 性 的 另 
一 个 方面 是 ， 很 多 用 其 他 编程 语言 编写 的 应 用 程序 也 可 以 选择 编译 到 这 个 虚拟 ISA 或 客户 语言 ， 
而 不 是 直接 编译 到 本 地 机 器 码 ， 因 为 这 样 就 可 以 从 虚拟 机 的 各 种 特性 中 获 益 ,例如 可 移植 性 、 高 
性 能 和 安全 性 。 


虚拟 机 也 可 以 支持 非 安 全 语言 , 但 这 只 是 一 种 扩展 ,而 不 是 最 初 的 设计 意图 。 非 安全 语言 用 
于 辅助 安全 语言 访问 底层 资源 ， 或 者 重用 以 非 安全 语言 编写 的 遗留 代码 。 


1.3 ”虚拟 机 示例 


虚拟 机 作为 客户 语言 的 运行 时 引擎 ,可 以 根据 其 执行 引擎 的 实现 分 为 几 类 。 执行 引擎 是 表达 
应 用 程序 的 操作 语义 的 组 件 。 有 两 种 基本 的 执行 引擎 ， 分 别 是 解释 和 编译 。 

通过 解释 , 通 癌 不 会 从 应 用 程序 代码 生成 机 需 码 。 根 据 客户 语言 的 语法 规范 , 应 用 程序 代码 
被 解释 器 语法 分 析 为 可 表达 程序 语义 的 某 种 内 部 表示 , 然后 执行 引擎 通过 跟踪 实现 内 部 表示 的 操 
作 语 义 来 操纵 程序 状态 (也 就 是 对 代码 的 执行 )。 

通过 编译 , 应 用 程序 代码 也 会 被 解释 器 进行 语法 分 析 , 不 过 之 后 会 根据 操作 语义 将 其 翻译 为 
机 融 码 。 然 后 ， 主 机 会 执行 这 些 机 需 码 ， 以 此 操纵 应 用 程序 状态 。 

这 两 种 虚拟 机 之 间 并 没有 严格 的 界限 。 基 于 解释 器 的 虚拟 机 把 客户 语言 代码 编译 为 另 一 种 客 
户 语言 代码 ， 然 后 加 以 解释 ， 这 是 很 常见 的 。 在 编译 器 领域 ,“ 另 一 种 客户 语言 ”的 代码 通常 称 
为 “中 间 表 示 ”( intermediate presentation, IR )。 虚 拟 机 先 解 释 执行 一 段 应 用 程序 代码 ， 然 后 再 编 
译 执行 一 段 应 用 程序 代码 ， 这 也 是 很 常见 的 。 

虚拟 机 可 以 用 软件 实现 , 也 可 以 用 硬件 实现 , 还 可 以 结合 二 者 实现 。 有 些 人 硬件 被 设计 为 直接 
执行 虚拟 ISA 指令 , 这 就 不 再 是 虚拟 机 了 , 因为 虚拟 ISA 已 经 不 再 是 虚拟 的 。 但 习惯 上 还 是 称 其 
为 虚拟 机 ， 只 是 用 硬件 实现 而 已 。 

既然 几乎 所 有 现代 语言 都 依赖 于 虚拟 机 , 那么 每 个 终端 用 户 的 系统 中 有 一 两 个 必 不 可 少 的 虚 
拟 机 也 就 不 足 为 奇 了 。 下 面 给 出 几 个 示例 。 


1.3.1 JavaScript 引擎 


最 常用 的 虚拟 机 可 能 就 是 Web 浏览 器 中 的 JavaScript 引擎 。 例 如 ，Google Chrome 的 V8 
JavaScript 引擎 Mozilla Firefox 的 SpiderMonkey、Apple Safari 的 JavaScriptCore， 以 及 Microsoft 
IE 的 Chakra。 它 们 都 是 独立 开发 的 ， 并 采用 了 不 同 的 技术 来 加 速 JavaScript 代码 执行 。 


1.3 ”虚拟 机 示例 5 


最 早出 现 的 JavaScript 引 擎 名 为 SpiderMonkey。 Firefox 将 其 从 纯粹 的 基于 解释 的 虚拟 机 逐步 
演化 为 基于 编译 的 引擎 ， 这 其 中 经 历 了 一 系列 项 目 ， 例 如 TraceMonkey 、JigerMonkey 和 
IonMonkey。SpiderMonkey 在 2015 年 的 版 本 把 JavaScript 代码 翻译 为 字 节 码 形式 的 IR, 然后 调用 
IonMonkey 把 字 节 码 编译 为 机 器 码 。 从 内 部 来 看 ，IonMonkey 是 传统 的 静态 编译 器 ， 通 过 静态 单 
IRIE (static single assignment, SSA ) 表示 来 构造 控制 流 图 (control flow graph, CFG )， 从 而 使 
得 高 级 优化 成 为 可 能 。 


1.3.2 Perl 引擎 


另 一 类 广泛 使 用 的 虚拟 机 是 传统 脚本 语言 虚拟 机 ， 例 如 UNIX shell, Windows PowerShell , 
Perl, Python 和 Ruby。 它 们 被 称 为 脚本 语言 ， 是 因为 它们 通常 都 以 “编写 ,执行 ”这 样 的 交互 方 
式 使 用 ,开发 周期 很 短 。 交 互 执行 意味 着 程序 执行 一 行 代 码 , 然后 等 待 程序 员 输入 下 一 行 代码 来 
执行 。 脚 本 语言 也 常用 于 批量 执行 或 自动 执行 一 系列 任务 。 

要 支持 任务 的 批量 执行 , 相 比 于 编写 单个 执行 任务 的 语言 , 脚本 语言 在 语言 设计 方面 要 更 加 
高 级 。 在 编程 语言 领域 ， 它 们 通常 被 归 类 为 “高 级 ”或 “非常 高 级 ”的 语言 ; 也 就 是 说 ， 它 们 是 
安全 语言 ， 并且 易 于 编写 特定 领域 的 任务 。 正 如 前 文 所 述 , 安全 语言 需要 虚拟 机 来 提供 安全 需求 
和 底层 支持 。 交 互 模式 文 持 通常 意味 着 虚拟 机 具有 基于 解释 的 执行 引擎 。 

由 于 在 Web 通用 网 关 接口 编程 方面 的 广泛 应 用 , Perl 是 20 世纪 90 年 代 后 期 最 流行 的 脚本 语 
言 之 一 。Perl 虚拟 机 就 是 一 个 解释 器 。 它 有 两 个 阶段 : 第 一 阶段 把 Perl 程序 翻译 为 一 系列 操作 码 
(FERH op code MF TH ), 然 后 第 二 阶段 一 步 步 遍历 op code 序列 来 执行 它们 .对 于 每 个 op code, 
调用 一 个 相应 的 函数 ( 称 为 pp code ) 来 实现 其 语义 。 在 两 个 阶段 之 间 会 执行 一 些 优化 来 缩短 op 
code 序 列 ， 或 者 把 某 些 序 列 替 换 为 更 快 的 表达 形式 。 

现在 Perl 语言 分 裂 为 两 个 变 体 ，Perl 5 和 Perl 6， 这 是 因为 这 两 种 分 离 的 语言 规范 之 间 并 不 
兼容 ， 尽 管 多 数 特性 还 是 共享 的 。Perl 5 是 传统 Perl 的 自然 演进 ， 而 Perl 6 实际 上 已 经 是 全 新 的 
设计 。 目前 有 一 些 可 用 的 Perl 6 实现 , 但 其 中 没有 100% 完 整 的 。Rakudo Perl 和 ParrotVM 是 其 中 
的 代表 。Rakudo 把 Perl 程序 翻译 为 一 种 ParrotVM 定义 的 字 节 码 ， 然 后 ParrotVM 执行 这 些 字 节 
码 序列 。 由 于 Perl 6 社区 试图 用 Perl 6 ( 的 某 个 子 集 ) 本 身 开 发 编译 器 (Rakudo )， 所 以 涉及 自 举 
(bootstrapping ) 的 问题 ， 因 此 实际 的 设计 会 更 复杂 一 些 。 





1.3.3 Android Java VM 

Google Android 是 一 种 用 于 智能 设备 的 操作 系统 。Android 应 用 程序 的 主要 编程 语言 是 Java 
的 一 种 变 体 。Java 程序 被 编译 为 JVM 字 节 码 , 然后 翻译 为 另 一 种 形式 的 字 节 码 , 称 为 dex。Android 
应 用 程序 以 打包 dex 字 节 但 的 形式 发 布 ， 一 同 发 布 的 还 有 其 他 形式 的 代码 和 资源 。 

智能 设备 执行 Android 应 用 程序 的 时 候 ， 需 要 虚拟 机 来 执行 dex 代码 。 在 Kitkat 版 本 之 前 的 
Android 版 本 中 ， 虚 拟 机 名 为 Dalvik， 它 有 一 个 解释 器 以 及 一 个 即时 (just-in-time ) 编译 器 。( 实 
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际 上 解释 器 包含 一 个 可 移植 版 本 和 一 个 快速 版 本 。) Dalvik 用 解释 器 开始 执行 dex 代码 ， 并 维护 
一 个 计数 器 来 记录 同一 dex 代码 片段 的 执行 次 数 。 一 旦 确信 某 段 dex 代码 足够 热 ( 即 频 繁 使 用 )， 
Dalvik 就 会 调用 编译 需 把 这 段 代 码 编 译 为 机 器 码 ， 然 后 下 次 就 可 以 直接 执行 机 咒 码 以 提高 性 能 。 

从 Kitkat 版 本 开始 ，Android 引入 了 一 个 名 为 ART ( Android Runtime ) 的 新 虚拟 机 。ART 在 
应 用 程序 安装 到 设备 上 时 就 把 dex 代码 编译 为 机 器 码 , 而 不 是 像 Dalvik 那样 在 应 用 程序 执行 时 编 
译 。 编 译 后 的 代码 绥 存 在 持久 存储 中 。 这 种 方法 称 为 预 编译 (或 AOT 编译 , AOT 即 ahead-of-time 
的 缩写 ), 应 用 程序 执行 时 ，ART 运行 时 引擎 直接 调用 预先 编译 的 代码 ， 而 无 须 解释 或 即时 编译 。 
这 样 应 用 程序 启动 过 程 就 会 更 快 。ART 用 更 长 的 安装 时 间 换 得 了 更 快 的 应 用 程序 启动 。 这 是 合理 
的 ， 因 为 应 用 程序 只 安装 一 次 , 但 通常 会 运行 多 次 。 而 且 由 于 安装 包 需 要 从 网 络 下 载 , 安装 时 间 
较 长 也 是 可 以 接受 的 ， 而 启动 时 间 则 是 用 户 与 设备 交互 过 程 中 至 关 重 要 的 一 点 。 


1.3.4 Apache Harmony 


Apache Harmony 是 由 Apache 软件 基金 会 和 社区 贡献 者 开发 的 一 个 开源 Java 实现 , 它 包括 一 
个 名 为 动态 运行 时 层 虚 拟 机 (Dynamic Runtime Layer Virtual Machine, DRLVM ) 的 JVM 实现 ， 
这 个 实现 对 Java SE 6 类 库 的 完成 度 超过 97%， 还 包括 一 组 工具 和 文档 。 

Google Android 采用 了 Apache Harmony 实现 的 一 个 子 集 作 为 其 Java 核心 库 ， 现 在 已 经 安装 
在 10 亿 多 台 设 备 上 。Apache Harmony 项 目 本 身 已 在 2011 年 终止 ， 但 在 Apache 网 站 上 仍然 可 以 
获得 其 代码 库 。2015 年 ，Google Android 不 再 采用 Apache Harmony 的 类 库 ， 转 用 OpenJDK。 

实现 完整 的 Java 平台， 特别 是 那些 大 量 的 类 库 ， 需 要 巨大 的 工作 量 ， 而 实现 一 个 JVM 则 相 
对 容易 一 些 。 据 我 所 知 ， 已 经 有 几 十 个 声明 对 外 发 布 的 JVM 实现 ， 但 独立 的 Java 类 库 实现 只 有 
3 个 : OpenJDK., GNU Classpath 和 Apache Harmony。 目 前 OpenJDK 库 实 现 可 能 是 唯一 仍 在 活跃 
维护 中 的 Java 类 库 。 

尽管 JVM 不 同 实现 的 代码 可 能 完全 不 同 ， 但 采用 的 技术 却 是 类 似 的 ， 这 是 因为 包含 学 术 界 
和 工业 界 在 内 的 社区 一 直 在 保持 着 积极 的 交流 。 


a 253 悍 拟 机 内 部 组 凤 





一 个 完整 的 语言 实现 通常 至 少 包 括 3 个 主要 部 分 : 虚拟 机 、 语 言 库 和 工具 集 。 

除非 是 非常 底层 上 且 非常 原始 的 语言 ,比如 针对 某 个 特定 处 理 需 的 汇编 语言 ,否则 一 个 党 用 语 
言 的 实现 通常 会 把 这 个 语言 的 核心 库 作 为 虚拟 机 的 一 部 分 包含 进去 。 有 时 候 这 个 虚拟 机 不 得 不 硬 
编码 一 些 只 能 用 于 关联 库 的 逻辑 。 例 如 ，Java 虚拟 机 ( JVM ) 不 能 没有 库 程序 包 java.lang， 这 是 
因为 有 些 核 心 数 据 结构 比如 Java 对 象 和 Java 类 一 一 依赖 于 程序 包 java.lang.Object 以 及 
java.lang.Class 中 的 定义 。 

为 了 能 用 某 个 语言 开发 程序 ， 通 常 需要 针对 这 个 语言 的 工具 集 与 虚拟 机 合作 ， 以 支持 调试 、 
性 能 分 析 ( profiling )、 打 包 ， 等 等 。 

库 与 工具 集 设 计 要 考虑 的 因素 不 同 于 虚拟 机 设计 , 所 需 的 专业 知识 也 大 相 径 庭 。 本 书 只 讨论 
虚拟 机 设计 





2.1 虚拟 机 核心 组 件 


同一 语言 的 不 同 虚拟 机 实现 可 能 在 所 有 方面 都 大 不 相同 ， 但 必须 遵循 并 支持 同一 个 语言 标 
准 。 因 此 ， 通 常 每 个 实现 都 必须 包含 一 系列 功能 类 似 的 核心 组 件 。 

根据 虚拟 机 的 共同 特征 , 一 个 实现 必须 有 把 应 用 程序 代码 加 载 到 内 存 中 , 并 把 符号 解析 到 内 
部 地 址 的 组 件 ( 加 载 融 与 动态 链接 顺 ); 有 执行 程序 操作 的 组 件 ( 执行 引擎 ); 管理 各 种 计算 资源 ， 
包括 内 存 (内存 管理 需 ) 和 处 理 器 (线程 调度 器 ); 为 该 语言 不 能 直接 访问 的 外 部 资源 提供 某 种 
访问 方式 (语言 扩展 或 者 本 地 接口 )。 


2.1.1 加 载 器 与 动态 链接 器 


加 载 器 的 功能 是 把 应 用 程序 包 加 载 到 内 存 中 , 将 其 解析 为 数据 结构 , 可 能 还 要 加 载 应 用 程序 
所 需 的 额外 资源 。 内 存 中 的 数据 结构 具有 语义 含义 ， 比 如 代码 或 数据 。 有 时 加 载 时 会 生成 反射 数 
据 或 元 数据 ， 帮 助 虚 拟 机 理解 应 用 程序 。 
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动态 链接 融 试 图 把 所 有 被 引用 的 符号 解析 到 可 访问 的 内 存 地 址 。 如 果 有 更 多 作为 符号 被 引用 
的 数据 和 代码 还 没有 被 加 载 的 话 ， 它 可 能 会 触发 加 载 融 加 载 这 些 数 据 和 代码 。 

加 载 器 和 动态 链接 器 有 时 候 是 不 可 分 离 的 , 并 在 同一 个 组 件 中 实现 。 有 些 系统 中 它们 合 称 为 
加 载 闫 ， 而 在 另 一 些 系 统 中 被 称 为 动态 链接 融 。 

注意 ,虚拟 机 通常 并 不 包括 链接 带 。 传 统 上 链接 融 是 指 把 编译 器 生 成 的 多 个 目标 文件 ( object 
file ) 链接 为 单独 的 集成 应 用 程序 包 的 组 件 。 它 是 一 个 编译 时 组 件 ， 而 动态 链接 需 是 一 个 运行 时 
组 件 , 在 应 用 程序 将 要 被 执行 的 时 候 使 用 。 澄 清 这 一 点 之 后 ,本 书后 文中 的 术语 “链接 咒 ” 特 指 
动态 链接 需 。 

出 于 安全 的 考虑 ,加 载 带 可 能 会 检查 被 加 载 应 用 程序 的 数据 及 代码 完整 性 。 在 某 些 虚 拟 机 设 
计 中 ， 这 个 检查 操作 可 能 被 推迟 ， 由 执行 引擎 处 理 。 


2.1.2 ”执行 引擎 


应 用 程序 一 旦 加 载 和 链接 之 后 , 就 可 以 由 执行 引擎 来 执行 了 。 执行 引擎 是 执行 程序 代码 指定 
操作 的 组 件 ， 也 是 虚拟 机 的 核心 组 件 。 这 是 显然 的 ， 因 为 应 用 程序 存在 的 目的 就 是 执行 。 

前 文 已 经 讨论 过 , 执行 引擎 可 实现 为 解释 器 或 编译 器 , 也 可 以 灵活 地 实现 为 二 者 的 混合 。 它 
也 是 决定 虚拟 机 实现 类 型 的 主要 因素 。 这 一 点 将 在 第 4 章 深 入 讨论 。 


2.1.3 ABs 


虚拟 机 通常 有 一 个 名 为 内 存 管理 带 的 组 件 来 管理 它 的 数据 ( 以 及 保存 数据 的 内 存 )。 根 据 数 
据 对 应 用 程序 是 否 可 见 ， 虚 拟 机 所 需 的 数据 大 体 上 可 以 分 为 两 类 。 
O 虚拟 机 数据 : 虚拟 机 需要 内 存 来 加 载 应 用 程序 代码 ， 并 持 有 广 持 数据 。 这 一 类 数据 对 应 
用 程序 是 不 可 见 的 ， 而 又 是 应 用 程序 执行 所 必需 的 。 
O 应 用 程序 数据 : 应 用 程序 需要 存储 它 的 静态 数据 和 动态 数据 。 这 一 类 数据 对 应 用 程序 是 
可 见 的 。 动 态 数据 存储 在 应 用 程序 的 堆 中 。 注 意 ， 栈 上 数据 在 编译 时 分 配 ， 并 不 由 内 存 
管理 天 管理 。 


内 存 管理 融通 常 只 管理 应 用 程序 数据 , 虚拟 机 数据 则 留 给 内 部 管理 或 者 底层 系统 。 在 实际 的 
虚拟 机 实现 中 , 内 存 管理 主要 管理 应 用 程序 动态 数据 ,也 就 是 应 用 程序 堆 的 内 存 。 这 是 设计 复杂 
度 与 收益 的 权衡 ， 因 为 应 用 程序 堆 数据 是 虚拟 机 执行 实例 所 有 数据 中 最 活跃 、 最 动态 的 部 分 ， 
关注 堆 数据 就 可 以 很 大 程度 上 解决 虚拟 机 的 大 部 分 内 存 问题 。 其 余数 据 的 管理 则 主要 留 给 底层 
系统 。 


根据 设计 的 不 同 , 内 存 管理 器 也 可 能 选择 把 管理 任务 委托 给 底层 系统 , 例如 通过 调用 malloc () 
和 free () 四 数 。 不 管 是 哪 种 情况 ， 对 虚拟 机 而 言 ， 内 存 管 理 器 组 件 总 是 必要 且 正 当 的 。 
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口 必要 性 : 正如 前 文 提 到 的 ， 安 全 请 言 不 允许 应 用 程序 直接 操纵 内 存 。 应 用 程序 代码 访问 
的 任何 数据 都 不 能 是 原始 内 存 ， 比 如 通过 malloc () 分 配 的 那样 。 它 们 必须 关联 到 某 个 
元 数据 或 者 管理 信息 ， 以 指明 数据 类 型 、 大 小 、 人 允许 的 操作 ， 等 等 。 元 数据 是 语言 相关 
的 ， 底 层 系 统 无 法 提供 元 数据 。 在 应 用 程序 可 见 层次 与 底层 系统 所 能 提供 的 层次 之 间 ， 
需要 内 存 管理 顺 充 当中 间 层 。 
口 正当 性 : 安全 语言 应 用 程序 通常 不 会 显 式 释放 为 其 数据 分 配 的 内 存 。 应 用 程序 可 能 会 给 
出 数据 生存 期 的 提示 ， 但 要 依赖 虚拟 机 来 执行 清除 。 尽 管 底层 系统 可 能 会 提供 某 种 层次 
的 内 存 回收 支持 ， 但 仍 需 要 虚拟 机 来 直接 管理 应 用 程序 数据 ( 以 及 关联 内 存 ) ， 因 为 只 
有 虚拟 机 准确 地 了 解 应 用 程序 的 数据 类 型 和 生命 周期 。 如 果 内 存 管 理 器 不 去 辅助 回收 已 
经 无 用 的 数据 ， 虚 拟 机 可 能 仍然 能 够 正确 运行 ， 但 是 资源 使 用 和 性 能 会 受到 影响 。 
在 操作 系统 中 , 传统 的 内 存 管 理 器 关注 内 存 分 配 ,依赖 应 用 程序 来 显 式 释放 内 存 , 或 者 等 待 
应 用 程序 退出 ， 以 回收 所 有 进程 内 存 。 与 之 相对 的 是 ,虚拟 机 中 的 内 存 管理 器 关注 内 存 回收 。 为 
了 高 效 回收 内 存 , 内 存 管 理 器 也 需要 处 理 内 存 分 配 。 因 为 内 存 回收 是 内 存 管理 器 自动 为 应 用 程序 
执行 的 ， 所 以 社区 通常 称 其 为 “自动 内 存 管理 器 ”， 或 者 更 常用 的 “垃圾 回收 需 ”。 


2.1.4 线程 调度 器 


当 系统 不 想 把 所 有 操作 都 放 到 单个 序列 中 时 ,多 线程 化 使 得 系统 能 拥有 多 个 控制 流 。 多 线程 
化 有 时 也 简称 为 “线程 化 ， 这 不 会 引起 任何 混 消 。 

有 些 语言 有 内 建 的 线程 特性 , 有 些 则 没有 。 但 是 几乎 所 有 重要 编程 语言 的 虚拟 机 都 具有 某 种 
形式 的 线程 支持 ， 即 使 这 个 语言 本 身 并 没有 提供 内 建 支 持 。 这 是 因为 线程 是 提供 多 任务 、 并 行 化 
和 事件 协调 的 一 个 简单 方法 。 线程 化 并 不 是 实现 多 任务 的 唯一 方法 , 但 它 是 冯 : 诺 伊 曼 结构 计算 
机 上 最 常用 的 方法 。 和 其 他 系统 中 一 样 ， 实 现 线程 的 虚拟 机 组 件 称 为 线程 调度 器 ,因为 它 的 主要 
功能 就 是 调度 任务 执行 。 

垃圾 回收 天 辅助 执行 引 敬 利用 内 存 资源 , 而 线程 调度 器 辅助 利用 处 理 吕 资源。 在 目前 的 汉 ' 详 
伊 曼 计算 机 模型 体系 结构 中 ， 这 两 者 总 是 并 存 的 。 


215 ”语言 扩展 

由 于 安全 性 的 需求 , 安全 语言 或 高 级 语言 需要 依赖 虚拟 机 来 访问 底层 资源 。 有 两 种 相辅相成 
的 方法 来 提供 这 类 功能 。 

1. 运行 时 服务 

内 存 管理 器 是 一 个 把 应 用 程序 连接 到 底层 内 存 资源 的 例子 。 程 序 代码 只 需要 通过 封装 良好 的 
应 用 程序 接口 (API ) 来 声明 一 个 新 的 类 或 者 创建 一 个 新 的 对 象 即 可 。 它 对 内 存 一 无 所 知 ， 不 管 是 
虚拟 内 存 还 是 物理 内 存 。 然后 虚拟 机 的 运行 时 服务 实现 所 有 的 支持 , 这 些 支持 对 应 用 程序 而 言 是 透 
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明 的 。 其 他 的 运行 时 服务 的 例子 包括 性 能 分 析 ( profiling )、 调 试 、 异 常 /信号 处 理 和 互 操作 性 。 

有 时 候 ， 运 行 时 服务 可 以 通过 客户 端 /服务 器 架构 实现 。 服 务 提供 者 不 需要 与 应 用 程序 处 于 
同一 个 进程 中 ， 甚 至 不 需要 与 之 处 于 同一 个 机 器 中 。 

运行 时 服务 可 以 以 多 种 形式 提供 给 应 用 程序 , 比如 API, 运行 时 对 象 和 环境 变量 。 举例 来 说 ， 
JavaScript 大量 使 用 文档 对 象 模型 对 象 来 访问 不 能 直接 通过 JavaScript 访问 的 网 页 内 容 

2. 语言 扩展 

运行 时 服务 可 能 不 够 灵活 , 并 且 通 常 局 限于 语言 规范 及 其 执行 模型 所 定义 的 特定 功能 , 与 之 
相对 的 是 ,语言 扩展 能 够 为 语言 提供 当前 语言 规范 和 执行 模型 之 外 的 功能 。 在 编程 语言 社区 中 ， 
有 时 候 它 也 被 称 为 “外 部 功能 接口 ”( foreign function interface, FFI ). 

根据 设计 的 不 同 , 一 个 语言 可 以 用 多 种 方式 访问 以 另 一 种 语言 (也 就 是 外 部 语言 ) 编写 的 代 
码 。 例 如 ， 在 某 些 语言 中 ， 外 部 语言 的 代码 可 以 被 谍 入 或 内 联 (inline) 于 宿主 语言 中 ; 在 另 一 
些 语言 中 ， 则 只 能 通过 封装 好 的 函数 接口 、 对 象 、 类 、 模 块 等 调用 外 部 语言 代码 。 

由 于 其 底层 特性 ，C 语言 可 能 是 这 方面 最 常用 的 外 部 语言 。 它 被 用 作 操 作 系 统 和 系统 库 的 主 
要 编程 语言 ， 控 制 所 有 系统 资源 。 

Java 的 C 扩 展 称 为 Java 本 地 接口 (Java Native Interface )， 它 支持 用 C 语 言 实现 Java 方法 。 
PhoneGap 扩展 了 JavaScript， 以 便 访 问 智能 设备 环境 中 的 所 有 本 地 资源 。 实 际 上 , JavaScript 本 身 
也 可 以 看 作 HTML 这 个 标记 语言 的 外 部 语言 。 

注意 , 语言 扩展 和 为 语言 增加 功能 的 普通 库 并 不 相同 。 普通 库 不 能 提供 任何 超过 语言 能 力 本 
身 的 功能 。 换 名 话说 ， 普 通 库 只 是 把 常用 的 程序 集合 在 一 起 以 避免 重复 开发 。 语 言 扩展 是 能 够 扩 
展 语言 规范 的 功能 。 许多 语言 扩展 是 以 库 的 形式 提供 的 ， 有 时 候 这 会 造成 混淆 。 扩 展 功能 被 封装 
在 普通 库 中 ,隐藏 于 开发 者 视线 之 外 。 例 如，Java 语 言 中 文件 相关 的 操作 和 系统 调用 就 是 封装 在 
Java.io.File 这 样 的 Java 标 准 库 中 的 。 


2.1.6 ”传统 模型 与 虚拟 机 模型 


从 传统 计算 模型 的 角度 看 ， 虚 拟 机 实际 上 拥有 几乎 相同 的 组 件 , 但 组 织 方式 不 同 。 例 如， 要 
在 X86 目标 机 器 上 支持 C 语 言 , 需要 一 个 像 GNU GCC 这 样 的 编译 器 把 源码 翻译 为 X86 机 器 人 码 ， 
然后 需要 链接 器 把 结果 打包 为 一 个 可 执行 文件 。 这 个 可 执行 文件 执行 的 时 候 ,， 需要 一 个 加 载 咒 把 
文件 加 载 到 内 存 中 , 然后 需要 一 个 动态 链接 器 把 所 有 被 引用 的 符号 解析 到 内 存 地 址 。 最 后 ,运行 
时 服务 准备 运行 栈 和 执行 上 下 文 ， 然 后 把 程序 控制 交 给 main () 函数 作为 入口 点 来 执行 这 个 应 用 
程序 。 在 多 任务 和 多 用 户 的 真实 系统 中 , 需要 操作 系统 来 协调 对 系统 资源 的 利用 , 特别 是 内 存 和 
处 理 器 。 除 了 运行 时 服务 , 操作 系统 还 提供 了 一 种 语言 扩展 形式 一 一 系统 调用 一 一 让 语言 能 够 完 
全 访问 本 地 资源 。 图 2-1 展示 了 语言 支持 的 传统 模型 。 
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图 2-1 语言 支持 的 传统 模型 


基本 上 ,传统 模型 把 语言 支持 解 耦 为 两 个 阶段 : 以 编译 器 为 中 心 的 编译 时 阶段 ; 围绕 着 操作 
系统 的 运行 时 阶段 。 使 得 这 种 解 耦 成 为 可 能 的 关键 点 是 编译 器 的 使 用 , 在 传统 模型 中 它 不 是 执行 
引擎 的 一 部 分 。 如 果 使 用 解释 器 的 话 ， 这 种 解 耦 就 不 可 能 做 到 了 。 

不 同 于 传统 模型 ， 虚 拟 机 把 所 有 组 件 放 在 一 起 , 在 运行 时 完成 所 有 工作 。 如 果 想 要 一 个 可 以 
直接 运行 C# 程 序 源 代码 的 操作 系统 的 话 ， 那么 这 个 系统 最 终 就 是 一 个 C# 虚 拟 机 ， 也 就 是 一 个 实 
际 执行 C# 语 言 的 机 器 。 所 以 传统 模型 与 虚拟 机 的 本 质 区 别 就 在 于 处 理 程序 代 人 码 的 时 机 。 如 环 
只 在 运行 时 处 理 的 话 , 这 个 系统 就 是 一 个 虚拟 机 。 这 也 是 虚拟 机 被 称 为 运行 时 引擎 或 者 运行 时 系 
统 的 原因 。 图 2-2 展示 了 语言 支持 的 虚拟 机 模型 。 


运行 时 





图 2-2 语言 支持 的 虚拟 机 模型 


这 两 种 模型 并 非 总 是 界限 分 明 的 。 虚拟 机 也 可 能 提前 进行 部 分 预 处 理 , 或 编译 应 用 程序 以 节 
省 运行 时 开销 。 这 里 有 几 个 安装 时 处 理 的 例子 。Android Dalvik 会 在 安装 时 通过 一 个 名 为 dexopt 
的 程序 预 处 理应 用 程序 dexcode， 这 个 程序 使 得 代码 序列 更 简明 。Android 运行 时 用 dex2oat 把 应 
用 程序 dexcode 编译 为 机 器 码 。Microsoft NET 有 一 个 名 为 NGEN.exe ( NGEN 即 native image 
generator， 本 地 映像 生成 器 ) 的 工具 把 通用 中 间 语 言 (Common Intermediate Language, CIL ) 字 
节 码 编译 为 机 融 人 码 。 


2.2 EHM ISA 


语言 虚拟 机 可 以 实现 真实 语言 , 也 可 以 实现 虚拟 语言 。 这 里 虚拟 语言 的 意思 是 没有 人 直接 使 
用 它 来 编程 ， 它 只 会 由 工具 自动 生成 。 换 句 话 说， 虚拟 语言 通常 用 作 其 他 语言 的 编译 目标 。 
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有 些 语言 生来 就 是 作为 编译 目标 语言 存在 的 ， 还 有 一 些 语言 则 原本 按照 编程 源码 语言 来 设 
it, 但 常 被 用 作 虚 拟 语言 。 比 如 ， 因 为 JavaScript 语言 非常 流行 ， 在 因特网 上 被 广泛 使 用 ， 所 以 
它 被 用 作 许 多 其 他 语言 的 编译 目标 ,如 果 某 个 特定 语言 的 程序 总 是 可 以 被 编译 为 JavaScript 代码 ， 
这 个 语言 就 自动 获得 了 具有 浏览 器 或 者 服务 端 JavaScript 引擎 的 所 有 平台 的 支持 。 

然而 , 虚拟 语言 生来 就 是 作为 编译 目标 语言 存在 的 。 尽 管 有 些 开 发 者 能 够 直接 用 虚拟 语言 编 
呈 ， 但 虚拟 语言 更 多 用 于 中 间 表 示 。 因 此 ， 虚 拟 语言 多 数 是 人 类 不 可 读 的 ， 例 如 Java 字 节 码 、 
LLVM 位 码 和 ParrotVM 字 节 码 。 这 里 “人 类 不 可 读 ”的 意思 是 “与 人 类 语言 区 别 太 大 ， 相 对 来 
说 无 法 人 工 编程 ”。 尽 管 汇编 语言 是 按照 编程 语言 来 设计 的 ， 但 由 于 其 原始 的 形式 ， 也 被 归 类 为 
虚拟 语言 。 

虚拟 指令 集结 构 (instruction set architecture, ISA ) 是 一 种 虚拟 语言 ， 定 义 了 虚拟 机 的 指令 
集 和 执行 模型 。 这 个 指令 集 可 能 类 似 于 真实 机 器 ISA。 这 也 是 它 被 称 为 虚拟 ISA， 以 及 它 的 实现 
被 称 为 虚拟 机 的 原因 。 最 广为人知 的 虚拟 ISA 可 能 就 是 JVM。 


2.2.1 JVM 


JVM 规范 不 仅 是 一 组 虚拟 指令 ， 而 且 还 是 一 个 抽象 计算 机 的 所 有 体系 结构 模型 ， 包 括 执行 
模型 、 内 存 模 型 、 线 程 模型 和 安全 模型 。 对 于 一 个 符合 规范 的 JVM 实现 ， 这 些 都 是 不 可 或 缺 的 。 

JVM 指令 的 操作 码 (opcode ) 编码 为 一 个 字 节 ， 所 以 称 为 字 节 码 。 操 作 码 是 规定 指令 要 执行 
的 操作 的 数据 。 有 些 JVM 指令 还 包含 操作 码 之 后 的 额外 字 节 来 指定 参数 , 称 为 操作 数 ( operand )。 
有 一 个 特殊 的 字 节 码 “wide” 作 为 指令 前 级 ， 人 允许 紧 随 其 后 的 操作 码 来 操作 更 长 的 参数 。 

一 个 字 节 可 以 编码 256 个 数字 ， 目 前 202 个 已 投入 使 用 ，51 个 未 使 用 ， 还 有 3 个 为 JVM 实 
现 的 运行 时 服务 保留 ， 不 应 该 出 现在 应 用 程序 代码 中 。 其 中 一 个 保留 字 节 码 是 0xca， 用 来 支持 
JVM 的 “ 断 点 ”功能 。 在 之 后 的 文本 中 ,“Java 字 节 码 ”“JVM 指令 ”和 “JVM 语言 ”是 同义词 。 

注意 ，Java 字 节 码 与 Java 编程 语言 之 间 没 有 固有 的 或 强制 性 的 关系 。 它 被 称 为 Java FHI, 
只 是 因为 它 最 初 被 设计 用 来 作为 Java 语言 的 编译 目标 语言 。 因 此 ,它们 有 一 些 共用 的 概念 和 词汇 。 
作为 类 比 ， 我 们 可 以 把 Java 字 节 码 看 作 X86 汇编 语言 ， 把 JYM 看 作 Intel X86 处 理 器 ， 把 Java 语 





Java FANE A Java 源码 编译 而 来 。 许 多 其 他 语言 也 可 以 编译 为 Java 字 节 码 ， 只 要 编 
译 结果 符合 JVM 规范 ， 就 可 以 在 JVM 中 运行 。 另 一 种 在 JVM 中 运行 其 他 语言 的 方法 是 用 Java 
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语言 开发 它们 的 语言 虚拟 机 ( 比如 一 个 解释 器 )。 换 句 话 说， 它们 的 虚拟 机 实际 上 是 Java 应 用 程 
序 。 接 下 来 ， 其 他 语言 的 应 用 程序 就 可 以 运行 在 它们 的 虚拟 机 中 ， 然 后 这 个 虚拟 机 作为 Java 应 
用 程序 运行 在 JVM 中 ，JVM 又 作为 一 个 可 执行 程序 运行 在 实际 机 器 中 。 

对 感 兴趣 的 读者 多 说 几 句 : JVM 也 可 以 用 Java 语言 来 开发 ， 但 不 是 非常 方便 ， 因 为 Java iE 
言 是 一 种 安全 语言 ， 这 使 得 底层 操作 比较 困难 。 通 常 需要 一 些 技巧 来 绕 过 语言 中 的 障碍 。 

Java 应 用 程序 以 Java 类 文件 的 形式 发 布 。 一 个 Java 类 文件 包括 单个 类 或 接口 的 定义 。 与 其 
他 二 进 制 文 件 格 式 ( 比如 可 执行 或 可 链接 格式 ) 一 样 ，Java 类 文件 主要 包括 字 节 码 序 列 ， 以 及 包 
含 字 节 人 码 序 列 引 用 符号 的 符号 表 。 

下 面 是 一 个 Java 类 文件 的 数据 结构 ， 以 类 C 语法 表示 : 


ClassFile { 


u4 magic; // OxCAFEBABE 
u2 minor_version; // 类 文件 次 版 本 号 
u2 major_version; // 类 文件 主 版 本 号 


u2 constant_pool_count; // 下 一 项 的 条 目 数量 
cp_info constant_pool[constant_pool_count-1]; // 常量 


u2 access_flags; // 类 访问 标志 

u2 this_class; // 本 类 在 常量 池 中 的 索引 
u2 super_class; // 父 类 在 常量 池 中 的 索引 
u2 interfaces_count; // 实现 的 接口 数量 

u2 interfaces[interfaces_count]; // 接口 索引 
u2 fields_count; // 类 中 字段 的 数量 
field_info fields[fields_count]; // 字段 描述 
u2 methods_count; // 类 中 方法 的 数量 
method_info methods[methods_count]; // 方法 描述 
u2 attributes_count; // 类 中 属性 的 数量 


attribute_info attributes[attributes_count]; // 属性 
} 


最 有 趣 的 条 目 之 一 是 每 个 method_info 中 的 code_attripute。 下 面 给 出 code_attribute 


的 数据 结构 : 
Code_attribute { 
u2 attribute_name_index; // code_attribute 总 是 名 为 “code” 
u4 attribute_length; // 后 面 项 目的 长 度 
u2 max_stack; // 执行 时 的 最 大 栈 深度 
u2 max_locals; // 局 部 变量 最 大 数量 
u4 code_length; // 字 节 码 序 列 长 度 
ul code[code length]; // 方法 的 字 节 码 序 列 
u2 exception_table_length; // 异常 数量 
{ u2 start_pc; // 一 个 异常 活跃 范围 开始 点 
u2 end_pc; // 一 个 异常 活跃 范围 结束 点 
u2 handler_pc; // 异常 处 理 函 数 开始 点 
u2 catch_type; // 异常 类 索引 
} exception_table[exception_table_length]; // 所 有 异常 表 
u2 attributes_count; // 方法 的 属性 数量 


attribute_info attributes[attributes_count];// 属性 
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以 下 是 由 一 个 简单 Java for 循环 编译 得 来 的 字 节 码 序列 示例 。 先 给 出 Java 源码 : 


public static void main(String args[]) { 
ipe j= 
for (int i=0; i<10; i++) 
j*=2; 
} 
return; 
} 
然后 是 编译 后 的 字 节 序列 , 以 及 注释 中 的 操作 码 助 记 符 和 语义 。 注 意 这 一 段 字 节 码 序列 不 一 


定 是 由 上 面 的 Java 代码 编译 生成 的 ， 也 可 能 是 通过 编译 其 他 语言 源码 生成 的 ， 甚 至 是 直接 编码 
的 ， 就 像 汇编 语言 一 样 。 


b1 


Method descriptor ([Ljava/lang/String;)V 
最 大 栈 深度 为 2， 最 大 局 部 变量 个 数 为 3 
局 部 变量 : 
args: 索引 为 0， 类 型 为 java.lang.Sstring[] 
j: 索引 为 1 ， 类 型 为 int 
i: 索引 为 2， 类 型 为 int 


// 0: iconst_1 ; 常量 值 1 压 栈 
// 1: istore_1 ; 栈 顶 弹出 并 保存 在 变量 1(j) 中 
// 2: iconst_0 ; 常量 值 0 RR 
// 3: istore_2 ; 栈 顶 弹出 并 保存 在 变量 2(i) 中 
00 0a // 4: goto +10 ; 跳 转 到 位 置 14 (=4+10) 的 字 节 码 处 
// 7: iload_1 ; 局 部 变量 1(j) 压 栈 
// 8: iconst_2 ; 常量 2 ER 
// 9: imul ; RUMP LAAAA, WR, RER 
// 10: istore_1 ; 栈 顶 弹出 并 保存 到 变量 11(]) 
va Wr vf Ua iine 21 ; 变量 2(i) 增 加 1 
// 14: iload_2 ; 局 部 变量 2(i) 压 栈 
0a // 15: bipush 10 ; 4.10 RR 
ff £6 // 17: if_icmplt -10; 栈 顶 弹出 两 个 条 目 ， 
// ; 条 件 跳 转 到 位 置 7(=17-10) 处 
// 20: return ; return 


在 不 同 的 上 下 文中 ，JVM 有 两 个 可 能 的 含义 。 一 个 是 指 Sun Microsystems ( 现在 是 Oracle ) 
的 JVM 规范 定义 的 抽象 计算 机 ， 另 一 个 是 指 JVM 规范 的 一 个 虚拟 机 实现 。 有 时 候 我 们 用 所 有 首 
字母 大 写 的 JVM 指 代 抽 象 模型 ， 使 用 小 写 的 jvm 表示 实现 。JVM 规范 (不 考虑 版 本 号 ) 只 有 一 
个 ,但 不 同 的 JVM 实现 有 很 多 。JVM 规范 独立 于 Java 语言 规范 发 布 。 但 是 从 Java Standard Edition 
(SE) 7 开始 ，JVM 规范 和 Java 语言 规 范 以 相同 的 Java SE 版 本 号 联合 发 布 。 

应 用 程序 提供 给 JVM 之 后 ，JVM 的 类 加 载 器 加 载 并 解析 初始 类 文件 ， 然 后 把 项 目 放 在 内 存 
中 相应 的 数据 结构 中 。 接 下 来 ，JVM 把 所 有 的 符号 引用 解析 到 直接 引用 的 内 存 地 址 。 类 初始 化 
之 后 〈 即 调用 初始 化 器 之 后 )，JVM 调用 初始 类 的 main () 方 法 来 执行 这 个 应 用 程序 。 

Java 平 台 (例如 Java SE 8) 是 一 个 Java 语 言 、JVM、jJava 类 库 和 工具 的 规范 集合 。Java X 
现 (例如 OpenJDK 8 ) 是 一 个 Java 平 台 的 完整 实现 。Java 平 台 有 不 同 的 版 本 ( 或 者 profile )， 称 
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为 标准 版 (Java SE )、 企 业 版 (Java EE) 等 。 它 们 都 共享 同样 的 Java 语言 规 范 和 JVM 规范 ,但 
是 定义 了 不 同 的 库 ， 并 可 能 有 不 同 的 实现 。 


222 JVM CLR 


经 过 与 Java 的 数 年 争斗 , Microsoft 设计 了 安全 语言 C#, 以 及 用 途 更 广泛 的 .NET 框架 。.NET 
框架 是 一 个 通用 语言 基础 架构 (Common Language Infrastructure, CLI) 规范 的 实现 。 像 Java $ 
台 一 样 ，CLI 包含 了 多 个 组 件 ， 比 如 名 为 虚拟 执行 系统 ( Virtual Execution System, VES ) 的 虚拟 
机 规范 和 名 为 CLI 标 准 库 的 类 库 规范 。 通 用 语言 运行 时 (Common Language Runtime, CLR ) 虚 
拟 机 是 VES 的 .NET 实现 。 

Java 这 个 术语 已 经 承载 7 太 多 意义 。CLI 试 图 把 规范 名 称 和 实现 名 称 分 离开 来 ， 尽管 这 可 能 
会 导致 更 多 的 混 消 。 

表 2-1 给 出 了 一 个 非常 高 层 的 Java 与 CLI 的 术语 对 比 。 


表 2-1 CLI 平 台 与 Java 平台 概念 对 比 





平台 概念 通用 语言 基础 架构 Java 平台 

虚拟 机 虚拟 执行 系统 Java 虚拟 机 
虚拟 机 语言 通用 中 间 语 言 Java F45 
发 布 包 Assembly JAR ( Java 类 文件 ) 
库 标准 库 Java 类 库 

主要 的 高 级 语言 C# Java 
语言 扩展 平台 调用 服务 Java 本 地 接口 

-个 平台 实现 Microsoft .NET 框架 Oracle OpenJDK 
一 个 VM 实现 通用 语言 运行 时 Hotspot 


CLI Fil Java 有 两 个 “与 众 不 同 ” 的 特征 值得 指出 。 

(1) CLU 从 发 明之 初 开 始 ， 就 试图 提供 遵循 CLI 语言 规范 的 跨 语言 交互 性 。 已 知 的 符合 CLI 
规范 的 语言 包括 C#、C+HCLI、VB.NET、IronPython 和 IronRuby。 尽 管 语 言 交 互 性 并 不 是 Java 
的 设计 目标 ， 但 对 Java 来 说 ， 只 要 一 个 语言 可 以 编译 为 Java 类 文件 ， 就 自动 获得 了 这 个 特性 。 

TA JVM 规范 的 语言 包括 Java, Groovy, Scala, Jython 和 JRuby。 由 于 这 种 相似 性 ，Java 和 C# 
实际 上 可 以 在 彼此 的 系统 中 实现 。 

(2) Microsoft 有 大 量 的 遗留 本 地 库 ， 特 别 是 Win32 API 服务 WREN C# 重 写 会 非常 及 烦 ， 
因此 CLI 提供 了 平台 调用 服务 ( Platform Invocation Service, P/Invoke )， 用 于 安全 代码 访问 非 安 
全 本 地 代码 。 它 允许 开发 者 在 C# 人 代码 中 简单 地 导入 和 声明 目标 本 地 也 数 , 剩余 工作 由 编译 器 和 运 
行 时 为 开发 者 执行 。 相 比 之 下 ，Java 本 地 接口 会 更 麻烦 一 些 ， 因 为 需要 用 人 工 数 据 转 换代 码 封装 
本 地 函数 。 但 是 ，Java 要 提供 类 似 P/Invoke 的 支持 并 不 困难 。Java Native Access 的 目标 就 在 于 此 。 
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以 下 是 一 个 由 简单 的 C# for 循环 编译 而 来 的 CIL 字 节 人 码 序列 。 先 给 出 C# 源 人 码 : 


static void test( ){ 
ane 2 = O 
while(i < 10) { 
i++; 


} 


然后 是 编译 后 的 CIL 字 节 码 序列 ( 只 展示 了 操作 码 助 记 符 ) 和 注释 中 的 语义 。 和 Java 字 节 
码 一 样 ，CIL 字 节 码 不 一 定 由 以 上 的 C# 源 码 生成 。 它 也 可 能 从 其 他 语言 的 源码 编译 而 来 ， 其 至 
可 能 像 汇编 语言 一 样 是 直接 编写 的 。CIL 和 Java 字 节 码 的 相似 之 处 显而易见 。 

.method private hidebysig static void test() cil managed 

-maxstack 2 


<lecals anit CH int32 i, 
[1] bool CS$4$0000) 


IL_0000: nop // 空 操作 ， 只 用 于 调试 

IL_0001: ldc.i4.0 // 加 载 常 数 0 到 栈 上 

IL_0002: stloc.0 // 弹出 栈 并 保存 在 索引 为 0 的 局 部 变量 (i) 
IL_0003: br.s IL_000b // 跳 转 到 IL_000b 

IL_0005: nop // 空 操作 

IL_0006: ldloc.0 // 加 载 局 部 变量 i BRE 

IL_0007: ldc.i4.1 // 加 载 常量 1 BRE 

IL_0008: add // 栈 顶 弹出 两 个 条 目 ， 相 加 ， 把 结果 压 栈 
IL_0009: stloc.0 // 弹出 栈 项 并 保存 到 局 部 变量 i 
IL_000a: nop // 空 操作 

IL_000b: ldloc.0 // 加 载 局 部 变量 i FRE 

IL_000c: ldc.i4.10 // 加 载 常量 10 BRE 

IL_000d: clt // 栈 顶 弹出 两 个 条 目 ， 比 较 (<) ， 结 果 压 栈 
IL_000f: stloc.1 // 弹出 栈 顶 ,保存 到 索引 为 1 的 局 部 变量 
IL_0010: ldloc.1 // 加 载 索 引 为 1 的 局 部 变量 到 栈 上 


IL_0011: brtrue.s IL_0005 // 弹出 栈 顶 ， 

// t RJ true, Dask] IL_0005 
IL_0013: ret // return 
} 


本 书 的 目标 不 在 于 讨论 或 对 比 任何 具体 VM 规范 。 这 里 只 是 简单 介绍 一 下 虚拟 ISA, 以 便 读 
者 理解 后 续 章 节 的 内 容 。 


第 3 和 曹 ” 庶 拟 机 中 的 数据 结构 





Java 虚拟 机 (SVM ) 的 实现 有 一 些 核心 数据 结构 ， 比 如 对 象 、 类 和 虚 聘 数 表 。 


3.1 对象 与 类 


JVM 语言 ( 即 字 节 码 指令 集 ) 有 两 个 数据 类 型 : 基本 类 型 和 引用 类 型 。 基 本 类 型 的 变量 持 
有 一 个 直接 值 ， 比 如 一 个 数字 、 一 个 布尔 值 或 一 个 返回 地 址 。 在 某 些 其 他 语言 中 ,基本 类 型 有 时 
候 也 称 为 值 类 型 。 引 用 类 型 的 变量 持 有 一 个 指向 对 象 的 指针 。 每 个 对 象 都 是 一 个 引用 类 型 ( 比如 
一 个 类 或 数组 ) 的 实例 。 本 书 其 他 部 分 中 ， 除 非特 别 指出 ,术语 “类 ”( class ) 泛 指 类 、 数 组 和 
接口 。 注 意 接 口 没 有 实例 ， 但 有 实现 接口 的 类 的 实例 。 图 3-1 中 展示 了 它们 的 关系 。 


Bar Bar Class 


OVAL mn, 实例 类 





被 指向 者 的 实例 被 指向 者 的 实例 seated ine ol 


Uae Pees es Cee p ERRIA 


-- ~ Vr 人 
一 一 一 各- 被 指向 者 的 指针 jense 


: 被 指向 者 的 子 类 
- 一 -和 被 指向 者 的 实例 Object 
类 





5 被 指向 者 的 子 类 


图 3-1 对 象 、object 和 class 的 关系 


一 个 类 定义 了 两 部 分 数据 : 实例 数据 和 类 数据 。 实 例 数据 由 各 个 对 象 独自 拥有 ， 而 类 数据 由 
同一 个 类 的 所 有 实例 共享 。 每 个 类 在 内 部 也 表示 为 一 个 对 象 。 

Java 中 有 两 个 特殊 的 类 : Object 和 class。 它 们 都 在 Java API AY java.lang 包 内 。object 
类 是 所 有 类 的 父 类 ，class 类 是 所 有 类 的 类 型 。 它 们 是 系统 类 的 一 部 分 ,要 完整 表达 语义 ，JVM 
就 必须 支持 系统 类 。 举 例 来 说 ,引用 变量 ovar 持 有 指向 Bar 类 的 一 个 实例 的 指针 。Bar RAD 
是 class 的 一 个 实例 ，class 也 是 其 本 身 的 一 个 实例 。Bar 类 是 object 类 的 子 类 ，object 
本 身 也 是 自身 的 一 个 子 类 。 
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数组 是 一 类 特殊 的 类 ， 由 虚拟 机 ( ) 创建 ， 而 不 是 从 类 文件 中 加 载 。 和 其 他 类 一 样 ， 
个 数组 类 也 是 class 类 的 一 个 实例 ， a l Object 类 的 子 类 


3.2 ”对 象 表示 


一 个 类 基本 上 定义 了 两 种 信息 : 一 种 是 实例 数据 , 包括 对 象 字 段 和 虚 方 法 ; 另 一 种 是 类 数据 ， 
包括 静态 字段 和 静态 方法 

为 了 表示 一 个 对 象 , 需要 分 配 一 ee 该 数据 由 它 的 类 和 它 的 所 有 父 类 定 
义 。 实际 上 , 因为 虚 方 法 由 一 pea 有 实例 共享 , 所 以 只 有 对 象 字 段 需要 为 每 个 实例 分 配 内 存 
ye 换 句 话说 , 指向 虚 方 
法 数据 结构 的 指针 ( 或 指针 链 ) 应 该 与 对 象 相关 联 

这 还 不 足以 表示 一 个 对 象 。 对 象 还 需要 访问 其 类 数据 的 方法 ， 比 如 ,检查 它 属于 哪个 类 。 可 

通过 简单 地 把 类 数据 和 虚 方 法 放 在 一 起 来 实现 这 一 点 , 这 样 它们 总 是 能 相互 访问 。 基 于 这 一 讨 
论 , 一 个 内 存 中 的 简单 布局 包括 两 部 分 一 -对象 头 和 对 象 字段 。 对 象 头 中 编码 了 一 个 指向 类 数据 
的 指针 ， 类 数据 包含 或 指向 虚 方法 数据 结构 ， 如 图 3-2a 所 示 

尽管 有 多 种 不 同 的 实现 ， tinge da 用 一 个 指针 指向 虚 方 法 指针 表 ( 称 为 “vtable” 
vtable 包含 指向 虚 方 法 的 函数 指针 ， 这 样 只 用 几 条 指令 就 可 以 执行 虚 方 法 调用 。 这 个 设计 基于 
下 观察 结果 , 即 VM mie Leen 一 类 是 对 象 字段 访问 , 另 一 类 是 虚 rot 
用 。 把 它们 放 在 一 起 有 助 于 提高 性 能 。 关 于 方法 的 其 他 信息 ， 比如 名 称 和 签名 等 ， 可 以 放 在 类 数 
据 中 。vtable 对 于 一 个 类 是 唯一 的 。 因 此 ，vtable 指针 有 时 可 以 用 作 类 的 标识 符 ， 如 图 3-2b 所 示 


ovar 


See 


ovar 对 象 





(a) (b) 
图 3-2 对象 头 中 包含 元 数据 ， 对 象 体 中 包含 字段 的 对 象 表示 : (a) 对 象 头 放置 类 指针 ; 
(b) 对 象 头 放置 vtable 指针 
类 数据 中 包含 类 的 所 有 描述 信息 ， 例 如 字段 、 方 法 、 实 现 接口 等 。 尤 其 考虑 到 每 个 类 都 是 
class 类 的 一 个 实例 ， 因 此 类 数据 还 包含 class 类 的 实例 数据 


3.3 “方法 描述 


方法 需要 一 个 VM 中 的 数据 结构 来 描述 它 的 信息 。 以 下 代码 给 出 了 一 个 典型 JVM 实现 中 的 
方法 信息 
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typedef struct Method{ 








char *name; i} 
char *descriptor; // 
Class *owner_class; // 
unsigned char *byte_code; ab 
Handler *handlers; ries 
LineNum *linenums; // 
LocalVar *localvars; // 
Exception *exceptions; // 
uint16 modifier; // 
uint16 max_stack; // 
uint16 max_locals; // 
uintl6 vtable_offset; EZ 
JIT_STATUS state; Fy 
unsigned char *jitted_code; // 
struct { 

unsigned is_init 

unsigned is_clinit 

unsigned is_finalize 

unsigned is_overridden 

unsigned is_nop H 
} flags; // 方法 属性 

} Method; 


这 个 数据 结构 包含 了 要 在 运行 时 编译 、 


PPPppP 


方法 名 

方法 描述 符 
拥有 这 个 方法 的 类 
字 节 码 序列 
异常 处 理 函 数 
行 号 表 

局 部 变量 

可 能 抛 出 的 异常 
方法 访问 控制 修饰 符 
最 大 栈 深 度 

最 大 局 部 变量 数量 
vtable 中 的 偏 移 量 


JIT 编译 状态 
编译 后 的 代码 


调试 、 性 能 分 析 和 链接 一 个 方法 所 需 的 所 有 信息 , 包 


括 用 于 异常 处 理 和 垃圾 回收 的 信息 。 根据 VM 实现 的 不 同 , 这 个 数据 结构 可 能 不 包含 jitted_code 
字段 ， 该 字段 用 于 即时 编译 。is_nop 标志 是 用 于 优化 的 ， 指 明 方法 是 否 内 容 为 空 。 


ign mee as \ 
AA 
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执行 引擎 是 执行 应 用 程序 代码 实际 操作 的 组 件 。 应 用 程序 的 最 终 目 的 就 是 执行 , 所 以 通常 认 
为 执行 引擎 是 VM 的 核心 组 件 , 其 余 组 件 是 执行 引擎 的 辅助 组 件 。 有 时 候 执行 引擎 的 设计 大 体 上 
决定 了 VM 的 设计 。 基 本 执行 机 制 有 两 种 ， 分 别 是 解释 和 编译 。 


4.1 解释 器 


解释 天 的 设计 是 很 直观 的 。 一 旦 应 用 程序 被 加 载 到 内 存 中 ， 并 已 经 被 解析 为 语义 数据 结构 ， 
VM 就 可 以 一 个 接 一 个 地 取得 代码 序列 并 执行 定义 的 操作 。 下 面 是 一 个 简单 解释 器 的 伪 代 码 。 


interpret (method) 
{ 
while( 序列 中 还 有 代码 ) { 
从 序列 中 读 取 下 一 个 代码 ; 
if (代码 需要 更 多 数据 ) { 
从 序列 中 读 取 更 多 数据 ; 

} 
执行 代码 指定 的 动作 ; 

} 


这 个 解释 器 应 该 适用 于 很 多 语言 。 这 个 算法 的 核心 就 是 代码 序列 上 的 大 循环 〈 称 为 分 发 特 
环 )， 这 个 循环 取得 、 解 码 并 执行 每 一 段 代码 。 真 实 的 复杂 性 隐藏 在 “执行 代码 指定 的 动作 ”这 
个 步骤 里 面 。 举 例 来 说 ， 如 果 代 码 要 创建 某 个 类 的 一 个 新 实例 ,解释 器 就 会 调用 垃圾 回收 需 来 分 


配 一 段 内 存 ， 把 这 段 内 存 内 容 清 零 ， 初 始 化 对 象 头 〈 比如 安装 这 个 类 的 vtable 指针 )， 然 后 返回 
对 象 指针 


如 果 代 码 要 调用 一 个 虚 方 法 , 那么 解释 器 需要 找到 这 个 方法 的 地 址 ,准备 一 个 栈 帧 ， 奈 栈 参 
数 ,， 通 过 递归 解释 来 调用 这 个 方法 ,然后 返回 结果 。 如 果 目 标 方法 的 代码 不 在 内 存 中 或 者 还 没有 
初始 化 ， 对 它 的 调用 可 能 会 引发 方法 代码 的 加 载 和 解析 。 换 句 话说 ，VM 的 所 有 支持 性 功能 响应 
着 解释 器， 用 绕 着 解释 器 工作 

如 果 执 行 流 被 异常 中 断 , 那么 解释 器 逻辑 就 没有 那么 直观 了 。 异常 把 控制 流 引 入 可 能 在 当前 
方法 之 外 的 异常 处 理 器 。 第 11 章 会 介绍 异常 处 理 。 
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4.1.1 超级 指令 


解释 的 速度 通常 比较 慢 ， 原因 之 一 是 这 个 分 发 大 循环 设计 在 每 个 被 解释 的 代码 处 都 涉及 分 
Lo 分支 可 能 引发 分 支 预 测 失 败 和 指令 缓存 未 命中 ,两 者 的 开销 都 很 大 。 分 发 还 涉及 很 多 内 存 访 
问 ， 用 于 读 取 和 解码 每 段 代码 。 我 们 很 容易 想到 一 种 加 速 技术 ,就 是 把 两 个 或 更 多 代码 合并 到 一 
趟 预 处 理 中 。 然 后 解释 器 一 次 可 以 获取 并 执行 多 条 代码 ,这 样 就 减少 了 分 发 次 数 。 这 种 合并 的 代 
码 有 时 也 被 称 为 超级 指令 、 快 速 指令 或 者 虚拟 指令 。 


PON, HH Java 字 节 码 给 一 个 局 部 变量 增加 一 个 常量 ， 通 常 需要 4 个 字 节 但 : 


wa 1 = var 2 4+ 23 

1: iload_l ; EIER 

2: iconst_2 ; 常量 值 2 RR 
3: iadd ; 栈 顶 两 个 条 目 相 加 


4: istore_1 ; 栈 顶 弹出 并 保存 在 变量 1 中 

如 果 在 一 个 方法 中 , 这 个 模式 很 常用 , 那 就 可 以 用 一 个 未 使 用 字 节 码 把 它们 合并 为 一 条 快速 
指令 。 然 后 解释 器 只 需要 解释 这 个 效果 等 同 于 4 个 字 节 码 的 单个 字 节 码 即 可 。 

因为 未 使 用 字 节 码 的 个 数 有 限 , 所 以 超级 指令 的 应 用 也 是 有 限 的。 一 种 思路 是 通过 对 工作 负 
载 进行 性 能 分 析 找 出 最 高 效 的 字 节 码 组 合 ， 从 而 为 不 同 的 工作 负载 定义 不 同 的 超级 指令 。 


4.1.2 选择 性 内 联 


另外 一 种 加 速 技术 是 ， 提 前 把 对 一 个 字 节 码 的 执行 逻辑 编译 为 二 进 制 机 器 码 ， 并 将 其 放 在 
VM 实现 里 。 当 分 发 到 这 个 字 节 码 时 ， 解 释 器 直接 把 控制 转移 到 VM 维护 的 这 段 机 器 码 。 更 进 一 
步 来 说 ,可 以 把 多 个 字 节 码 的 机 器 码 连接 到 一 起 ,以 免除 对 它们 的 分 发 。 这 个 技术 是 动态 超级 指 
令 生 成 的 一 个 变通 方法 ， 有 时 候 称 为 “选择 性 内 联 "。 

既然 需要 为 每 个 字 节 码 静态 生成 二 进 制 机 器 码 作为 VM 实现 的 一 部 分 , VM 开发 者 必须 确保 
生成 的 二 进 制 码 足 够 通用 ,适用 于 所 有 可 能 的 执行 上 下 文 。 有 时 候 ， 如 果 两 段 二 进 制 代码 不 能 直 
接连 接 ， 仍 然 需要 一 些 接 双 代码 。 因 此 ， 连 接 后 的 代码 质量 并 不 高 。 即 时 (just-in-time, JIT) 4 
译 可 以 解决 这 个 问题 。 


4.2 JIT 编 译 


JIT 编译 在 运行 时 把 一 段 应 用 程序 代码 编译 为 二 进 制 机 咒 码 ， 然 后 让 VM 直接 执行 生成 的 代 
码 ， 而 不 是 解释 原来 的 应 用 程序 代码 。 这 就 像 是 把 这 整 段 应 用 程序 代码 当 作 一 个 超级 指令 。 

JIT 的 第 一 个 问题 是 如 何 选择 要 编译 的 应 用 程序 代码 片段 。 人 们 有 目 然 会 考虑 把 一 个 方法 作为 
一 个 编译 单元 ， 因 为 它 有 定义 良好 的 语义 边界 。 这 也 解释 了 为 什么 几乎 所 有 典型 的 JIT 都 是 基于 
方法 的 。 
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4.2.1 基于 方法 的 JIT 


由 于 方法 是 一 个 基本 语言 结构 ， 基 于 方法 的 JIT 设计 很 好 地 融入 了 VM 架构 。 关 键 的 数据 结 
构 是 vtable。 在 VM 中 使 用 JIT 的 时 候 ， 类 的 vtable 被 安装 为 指向 虚 方 法 的 困 数 指针 。 例 如 ， 要 
调用 over . foo() ， 可 以 通过 ovar 的 vtable REIK% E BI 4-1 中 展示 了 vtable 数据 结构 。 





代码 缓存 
a ra: A 
Pe y i \ 
X \ 
e 
ovar 对 象 vtable 不 \ 
et 类 指针 mes | 
foo O 指针 | 
A 
\ 
1 
aoe 
$ ti 
7 Sa z \ / 
bar|() 二 进 制 代码 


图 4-1 vtable 数据 结构 


在 类 初始 化 过 程 中 ， 当 方法 还 没有 编译 的 时 候 , 指向 虚 阻 数 的 函数 指针 实际 上 指向 的 是 一 段 
跳板 代码 ， 它 会 调用 编译 器 来 编译 这 个 虚 方 法 。 当 这 个 虚 方 法 第 一 次 被 调用 的 时 候 , 就 会 调用 编 
译 器 。 编译 器 编译 这 个 虚 方 法 ,并 把 编译 后 的 二 进 制 代码 地 址 ( 也 就 是 指向 编译 后 方法 的 函数 指 
针 ) 安装 到 vtable 槽 位 中 ， 替 换 原来 指向 跳板 代码 的 的 指针 ， 然 后 把 控制 转 到 这 个 二 进 制 代码 来 
完成 第 一 次 调用 。 从 下 一 次 开始 , 任何 对 这 个 方法 的 调用 都 会 通过 vtable 直接 进入 到 编译 后 的 代 
码 。 如 果 不 再 需要 跳板 代码 ， 可 以 将 其 释放 ,也 可 以 留待 再 次 使 用 ， 以 防 为 了 节省 代码 缓存 占用 
的 内 存 释放 编译 后 代码 的 情况 。 图 4-2 中 展示 了 跳板 代码 与 JIT 编译 。 


foo () 跳板 代码 


ovar 






对 象 vtable 


foo () 二 进 制 代码 
Viable 


foo O Heh 


A 
bar 指针 4 4 
= a EL Sy i 


图 4-2 ”跳板 代码 与 JIT 编译 
通过 这 种 方式 ， 可 以 只 用 几 条 机 器 指令 很 快 完成 虚 方 法 调用 。 例 如 , 调用 ovar .foo() 的 步 
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又 可 以 用 下 面 的 伪 代 码 表示 。 


vtable = *ovar; // 从 ovar 指针 得 到 vtable 指针 
foo_funcptr = *(vtable + foo_offset); // 得 到 指向 foo () 的 指针 
(*foo_funcptr) (); // AA feat) 


如 果 是 用 于 X86 处 理 需 的 VM， 调 用 一 个 对 象 虚 方 法 的 指令 如 下 所 示 : 假定 eax 寄存 器 持 
有 ovar， 对 象 的 第 一 个 槽 位 ( 偏 移 0 ) 是 vtable HET, foo 方法 的 函数 指针 位 于 vtable 的 偏 移 
16 的 位 置 。 


movl (%eax), %eax // eax 现在 持 有 vtable 指针 
movl 16(%eax), %eax // eax 现在 持 有 foo 的 func_ptr 
call %eax // 调用 foo() 


在 方法 调用 之 前 ， 所 有 参数 都 应 该 已 经 由 调用 方 ( 即 发 起 调用 的 方法 ) 准备 好 ， 所 以 这 里 不 
需要 再 次 准备 参数 。 当 执行 最 后 一 条 call 指令 的 时 候 ，X86 处 理 需 会 把 这 个 调用 的 返回 地 址 自 
动 压 栈 ， 它 会 指向 这 条 call 指令 的 下 一 条 指令 。 

当 这 个 方法 没有 编译 的 时 候 , 调用 实际 上 会 像 下 面 这 样 进入 跳板 代码 。 假 定 方法 foo () 的 描 
述 数据 结构 位 于 0x7001234, JIT 编译 器 入 口 位 于 地 址 0x7005678。 


pushl $0x7001234 // fo0() 的 描述 地 址 
call $0x7005678 // jit compile (method) 的 地 址 
jmp %eax // eax 持 有 编译 后 代码 入 口 地 址 


跳板 代码 首先 把 虚 方 法 foo () 的 方法 数据 结构 地 址 压 栈 。 与 调用 foo ( ) 时 的 原始 栈 状 态 ( 即 
参数 和 返回 地 址 ) 相 比 ， 现 在 运行 时 栈 多 出 了 一 个 条 目 。 然 后 多 出 的 条 目 被 对 VM PR RK 
jit_compile() 的 调用 所 消耗 ， 栈 返回 到 调用 foo () 时 的 状态 。 为 了 让 被 调用 方 〈 即 被 调用 的 
函数 ) 清理 参数 ,需要 把 jit_compile() 定 义 为 sTDcaLL 调用 惯例 。 函 数 jit_compile() 的 
原型 如 下 。 


void* STDCALL jit_compile(Method* method) 


函数 属性 STDCALL 应 该 按照 VM 开发 环境 需要 来 定义 。 例 如， 如 果 使 用 GCC 的 话 , 可 以 定 
义 如 下 ， 此 时 可 能 需要 把 sTDcALL 放 在 函数 原型 的 结尾 。 


#define STDCALL __attribute__((stdcall) ) 


根据 X86 调用 惯例 ， 函 数 调 用 返回 值 保存 在 寄存 器 eax 中 。 这 里 ， 它 持 有 编译 后 二 进 制 代 
码 的 入 口 点 地 址 。 尽管 这 个 地 址 应 该 是 用 作 call 的 目标 , 但 用 jmp 指令 也 可 以 ,因为 返回 地 址 
已 经 由 call 指令 放 在 栈 上 了 。 下 次 调用 foo () 的 时 候 ，cal1l 指令 会 略 过 跳板 代码 直接 进入 这 
疫 二 进 制 代码 ， 因 为 vtable 槽 位 已 经 被 编译 器 更 新 为 指向 这 段 二 进 制 代码 。 

如 果 多 个 线程 想 要 调用 同一 个 方法 并 触发 方法 的 JIT 编译 器 ，VM 需要 确保 对 同一 方法 编译 
AY ARE. FP if Apache Harmony 的 jit_compile() 实 现 的 一 个 简化 版 本 。 


void* STDCALL jit_a_method(Method* kmethod) 
{ 
uint8* funcptr= NULL; 
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/* 确保 拥有 这 个 方法 的 类 已 经 初始 化 */ 


class_initialize( kmethod->owner_class ); 


/* 互 斥 编译 */ 
spin_lock( kmethod ); 


/* 如 果 已 经 编译 了 ， 返 回 */ 

if( kmethod->state == JIT_STATUS_Compiled ) { 
spin_unlock( kmethod ); 
return kmethod->jitted_code; 

} 


/* 现在 这 个 线程 拥有 这 次 编译 */ 
kmethod->state = JIT_STATUS_Compiling; 


if( ! kmethod->is_native_method ) { 
funcptr = compile( kmethod ); 
} else{ /* 从 即时 编译 到 本 地 代码 的 封装 */ 
funcptr = generate_java_to_native_stub( kmethod ); 
} 
/* 用 新 的 funcptr 更 新 Vtable #, FRPRAAOMRARGBHEH */ 
method_update_vtable( kmethod, funcptr ); 


/* 这 个 方法 已 经 编译 */ 
kmethod->state = JIT_STATUS_Compiled; 
spin_unlock( kmethod ); 


return funcptr; 
} 


上 面 代码 中 的 compile () PRE BE IZ Al BE Ae BAPE BL ti 9 SIC Ps a PE o 

注意 上 面 的 跳板 代码 中 ,我 们 已 经 很 大 程度 上 把 代码 序列 简化 为 一 个 对 5 itt_method() 的 直 
接 调用 。 在 现实 中 , 编译 个 方法 可 能 会 抛 出 异常 , 或 者 进入 Java 代码 执行 并 触发 垃圾 回收 (GC ), 
所 以 从 Java 代码 执行 到 JIT 编译 器 〈 用 本 地 代码 编写 ) 的 过 程 需要 完整 的 Java 到 本 地 转换 。 需 
要 记录 工作 来 确保 在 进入 本 地 代码 之 前 所 有 信息 都 准备 好 了 , 从 本 地 代码 返回 之 后 所 有 信息 也 都 
清理 好 了 。 我 们 将 在 第 7 章 讨 论 这 个 主题 。 


4.2.2 ”基于 踪迹 的 JIT 

近年 来 , 基于 踪迹 (trace ) 的 JIT 已 经 吸引 了 大 量 关注 。 踪迹 是 运行 时 执行 的 一 段 代码 路 径 。 
基于 踪迹 的 JIT 只 编译 指定 路 径 上 的 代码 ， 忽 略 不 在 指定 路 径 分 支 上 的 其 他 代码 路 径 。 

使 用 踪迹 作为 编译 单元 的 一 个 主要 动因 是 为 了 避免 编译 冷 代码 , 以 节省 编译 开销 , 包括 时 间 
和 空间 开销 。 基 于 方法 的 JIT 编 译 整 个 方法 ,包括 热 代码 和 冷 代码 ， 其 至 包括 永远 不 会 执行 的 代 
码 。 基 于 踪迹 的 JIT 分析 运 行 时 代码 执行 ， 只 编译 热 代码 路 径 ， 称 为 “踪迹 ”( trace ). 


基于 踪迹 的 JIT 需要 执行 以 下 任务 。 
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(1) 识别 并 形成 踪迹 。 

(2) 编译 足迹， 缓存 二 进 制 代码 。 

(3) 和 月 适应 性 地 管理 踪迹 。 

既然 踪迹 是 热 执行 路 径 , 那么 就 必须 在 运行 时 通过 性 能 分 析 来 识别 。 一 个 常用 的 分 析 方 法 是 
在 踪迹 的 可 能 入 口 构建 一 个 计数 器 。 每 次 执行 人口 后 的 代码 ， 就 递增 这 个 计数 器 的 值 。 当 计数 器 
达到 某 个 国 值 时 ， 这 段 被 执行 的 代码 就 被 看 作 热 代 码 。 

根据 设计 方式 的 不 同 ， 通 常 有 3 种 位 置 来 放置 计数 器 : 方法 开头 、 循 环 头 和 基本 块 。 

基于 方法 的 JIT 通常 使 用 基于 方法 的 性 能 分 析 ， 也 就 是 说 ， 如 果 某 个 方法 足够 热 ，VM 可 以 
选择 编译 它 ( 如 果 它 只 是 被 解释 过 ) 或 者 用 更 高 级 的 优化 重新 编译 它 ( 如 果 它 已 经 被 编译 过 )。 
基于 方法 的 分 析 实 现 起 来 很 直观 , 因为 方法 入 口 对 执行 引擎 来 说 总 是 已 知 的 。 但 是 基于 方法 的 性 
能 分 析 不 足以 识别 所 有 的 热 代 码 。 有 时 候 ， 应 用 程序 把 主要 时 间 花 费 在 一 个 方法 的 热点 循环 中 ， 
而 这 个 方法 本 身 只 会 被 调用 几 次 ， 比 如 Java 应 用 程序 的 main () 方 法 。 即 使 基于 方法 的 性 能 分 析 
识别 出 了 一 个 热 方 法 ， 这 个 方法 中 的 代码 也 可 能 不 全 是 热 代 码 。 

对 应 用 程序 的 性 能 优化 来 说 , 循环 通常 是 最 重要 的 ,因为 耗 时 的 应 用 程序 通常 会 在 循环 上 花 
费 很 多 执行 时 间 。 许 多 高 级 编译 优化 都 是 专门 针对 循环 开发 的 ， 比 如 循环 不 变量 提升 、 并 行 化 和 
向 量化 。 因 此 , 使 用 基于 循环 的 性 能 分 析 来 识别 热 代码 是 很 自然 的 做 法 。 可 以 在 编译 时 通过 分 析 
代码 控制 流 结 构 ， 或 者 在 运行 时 通过 分 析 后 向 边 ( back edge ) 来 识别 循环 结构 。 

编译 时 循环 识别 需要 VM 构造 应 用 程序 的 控制 流 图 , 然后 以 深度 优先 的 方式 这 历 这 个 图 。 指 
向 一 个 已 经 访问 过 的 节点 的 边 称 为 后 向 边 , 这 是 洪 在 循环 结构 的 一 个 指示 器 。 如 果 执 行 引擎 不 构 
造 控 制 流 图 的 话 ， 编 译 时 循环 识别 可 能 不 适用 于 基于 踪迹 的 JIT。 另 外 一 个 问题 是 ， 编 译 时 分 析 
可 能 只 会 找到 迭代 式 循环 ， 而 很 难 找到 递归 式 循环 。 

运行 时 循环 识别 更 简单 一 些 。 只 要 控制 流 回 到 已 经 执行 过 的 代码 ， 就 可 以 确定 循环 。 这 段 代 
码 也 被 认定 为 循环 头 ， 可 以 在 这 里 构造 一 个 计数 器 。 这 种 方法 只 能 在 解释 器 中 实现 ， 因 为 它 需 要 
监视 每 个 分 支 操作 的 执行 ,包括 普通 的 跳 转 、 切 换 、 调 用 、 返 回 和 异常 抛 出 。Mozilla Firefox 的 
TraceMonkey 就 使 用 这 种 方法 。 


Google Android 的 Dalvik VM 在 基本 块 层 级 分 析 热 代 码 。 它 为 每 个 最 大 基本 块 构造 一 个 计数 
器 。 这 里 基本 块 是 一 个 编译 器 术语 , 指 具 有 单个 和 人口 点 和 单个 出 口 点 的 一 段 代 码 。 最 大 基本 块 是 
指 不 能 再 扩大 的 基本 块 ， 也 就 是 说 ， 如 果 能 包括 更 多 指令 ， 它 就 不 再 是 基本 块 。 

一 旦 确定 了 一 段 热 代码 , 就 可 以 形成 一 条 踪迹 , 方法 是 在 它 的 下 一 次 执行 过 程 中 从 入 口 开始 
记录 操作 ( 即 路 径 追 踪 )， 入 口 就 是 这 个 踪迹 的 起 点 。 这 个 过 程 有 时 候 也 称 为 追踪 (tracing )。 对 
基于 循环 的 追踪 来 说 ,踪迹 的 终点 是 控制 流 回 到 起 点 的 位 置 。 对 基于 基本 块 的 追踪 来 说 , 踪迹 的 
终点 是 基本 块 的 出 口 点 。 这 两 种 方法 中 ,踪迹 的 长 度 都 是 有 限 的 ,以 避免 执行 偏离 期 望 路 径 。 如 
果 出 现 一 些 不 支持 的 情况 ， 比 如 异常 抛 出 或 者 进入 运行 时 服务 ， 那 么 追踪 过 程 可 以 中 断 。 
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基于 循环 的 踪迹 中 , 在 一 些 中 间 点 上 控制 分 支 可 能 会 离开 热 路 径 。 追踪 执行 过 程 中 只 记录 这 
些 点 上 控制 实际 通过 的 分 支 。 但 在 之 后 的 每 趟 执行 中 , 控制 可 能 不 走 记 录 在 踪迹 中 的 分 文 ， 而 走 
其 他 路 径 。VM 应 该 确保 这 种 情况 下 追踪 的 正确 执行 。 换 名 话说， 追踪 执行 应 该 能 够 在 中 间 点 离 
开 踪 迹 。 

在 记录 踪迹 的 时 候 , VM 也 记录 要 保持 踪迹 有 效 必须 满足 的 条 件 。 当 这 个 踪迹 被 编译 的 时 候 ， 
在 生成 代码 中 插入 条 件 检查 代码 ， 以 确保 跟踪 这 条 踪迹 的 条 件 都 满足 ; 如 果 条 件 不 满足 ,控制 流 
会 终止 踪迹 执行 ,并 根据 条 件 优雅 地 把 控制 转移 到 踪迹 外 路 径 。 这 个 条 件 检查 代码 称 为 “守卫 代 
码 ”( guard ) 或 者 “侧门 离开 ”( side exit )。 比 如 ， 对 于 下 面 的 循环 : 

for (i = 0; i < n; ++i) 

j += i; 
踪迹 的 伪 代 码 可 能 看 起 来 如 下 : 


start trace (int i, 可) 


++1; 
temp = j + i; 
guard( temp not overflow ); 


] = temp; 
guard( i <n Jz 
goto start_trace (int i, int J); 


在 JavaScript 这 样 的 动态 类 型 语言 中 ， 变 量 的 类 型 可 以 动态 变化 。 如 果 变 量 类 型 改变 ， 那么 
“同一 个 ”运算 符 ， 比 如 “+”， 在 运行 时 就 可 能 有 不 同 的 操作 。 踪 迹 只 记录 追踪 执行 时 的 类 型 ， 
如 果 在 后 面 的 执行 中 类 型 改变 , 执行 就 可 能 失效 。 因此, 踪迹 还 需要 守卫 特定 的 类 型 。 另 一 方面 ， 
特定 的 类 型 使 得 踪迹 可 以 应 用 很 多 编译 器 优化 。 例如， 如 果 一 个 踪迹 中 的 变量 都 是 小 整数 ,编译 
需 可 以 很 容易 地 利用 高 级 寄存 器 分 配 技术 优化 代码 。 和 否则 ， 就 需要 分 配 内 存 以 备 放 置 大 整数 。 实 
PRE, TraceMonkey 的 主要 动因 就 是 基于 这 样 一 个 观察 结果 , 即 多 数 程序 中 的 类 型 不 会 频繁 改变 ， 
踪迹 的 特定 类 型 覆盖 了 多 数 运 行 时 的 可 能 性 。 

从 踪迹 的 侧门 离开 会 导致 很 高 的 开销 。 如 果 侧 门 离开 频繁 出 现 的 话 , 踪迹 的 整个 使 用 效果 都 
会 大 打折 扣 。 侧 门 离开 频繁 发 生 的 一 个 解决 方案 是 动态 扩展 追踪 范围 。 

对 基于 循环 的 追踪 来 说 , 如 果 运 行 时 一 个 守卫 检查 失败 的 话 , VM 会 检查 它 在 踪迹 中 的 位 置 。 
如 果 它 位 于 踪迹 的 起 点 , 就 会 记录 一 个 新 的 踪迹 。 对 动态 类 型 语言 来 说 , 这 条 新 踪迹 通常 和 原来 
的 踪迹 是 同一 段 热 代码 ， 只 不 过 有 一 套 新 的 具体 类 型 。 如 果 守 卫 检 查 在 踪迹 的 中 部 失败 ，VM 会 
识别 踩 迹 的 一 条 分 支 ， 并 开始 分 析 它 的 热度 。 如 果 这 个 分 支 足 够 热 ， 就 会 从 它 开始 生成 一 条 新 踪 
迹 。 由 此 ， 新 踪迹 会 和 原 踪迹 一 起 形成 一 棵 “踪迹 树 "”。 应 该 控制 好 踪迹 的 分 支 数量 ， 以 避免 发 
生 “ 踪 迹 爆 炸 ” 的 情况 。 

在 基于 基本 块 的 追踪 中 , 可 以 把 基本 块 踪迹 “链接 ”起 来 ， 以 避免 运行 时 服务 或 解释 器 的 介 
入 。 也 就 是 说 ， 当 你 知道 要 从 一 条 踪迹 离开 , 进入 另 一 条 踪迹 的 时 候 ， 控 制 可 以 直接 转移 到 下 一 
条 踪迹 。 可 以 插入 守卫 代码 来 确保 链接 有 效 。 链 接 的 踪迹 也 可 以 构成 踪迹 树 或 者 踪迹 图 。 
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基于 循环 的 追踪 有 一 个 优点 : 可 以 自动 内 联 方 法 , 只 要 这 些 方 法 在 循环 踪迹 的 执行 路 径 上 即 
可 。 基 于 基本 块 的 追踪 通常 不 会 跨 过 方法 边界 ,除非 这 个 方法 极其 简单 ， 可 以 随时 内 联 。 这 两 种 
方法 都 不 能 处 理 递归 方法 追踪 。 尽 管 基于 循环 的 追踪 能 够 识别 一 个 递归 的 重复 执行 , 但 要 为 这 个 
递归 形成 踪迹 还 是 有 挑战 性 的 。 除 了 尾 递 归 ， 普通 递归 有 分 立 的 两 个 重复 执行 阶段 : 一 个 是 持续 
向 栈 上 压 人 新 的 方法 帧 的 “向 下 迭代 ”阶段 ， 另 一 个 是 从 栈 上 弹出 帧 的 “向 上 迭代 ”阶段 。 这 两 
个 阶段 彼此 之 间 并 不 了 解 ,， 所 以 第 二 个 阶段 必须 了 解 如 何 弹出 帧 并 向 调用 帧 传递 返回 值 。 这 非常 
随意 ， 很 难 正 确 处 理 。 即 使 解决 了 这 个 问题 ， 间 接 递归 仍 是 一 个 没有 解决 的 问题 ， 也 就 是 一 个 方 
法 通过 调用 另外 的 方法 来 调用 自身 。 

基于 踪迹 的 JIT 有 一 个 问题 : VM 如 何 确定 一 个 踪迹 是 否 已 被 编译 。 在 基于 方法 的 IT 中 ， 
这 个 问题 可 以 通过 使 用 vtable 来 解决 。vtable 链接 到 即时 编译 的 代码 ， 如 果 没 有 编译 就 会 链接 到 
跳板 代码 。 基 于 踪迹 的 JIT 没有 vtable， 因 为 踪迹 不 像 方法 那样 拥有 定义 恨 好 的 单元 。 基 于 踪迹 
的 JIT 需 要 一 种 方法 来 维护 踪迹 及 其 状态 。 一 个 简单 的 解决 方案 就 是 使 用 一 个 动态 表 ， 其 中 可 以 
插入 新 确定 的 踪迹 的 信息 。Dalvik VM 使 用 散 列 表 把 踪迹 起 始 地 址 映射 到 散 列 索引 ， 有 时 候 会 引 
起 散 列 冲突 ， 导 致 不 精确 的 踪迹 状态 。 例 如 ，Dalvik VM 把 性 能 分 析 计 数 器 存储 在 散 列 条 目 中 ， 
如 果 有 新 踪迹 映射 到 同一 条 目 中 , 这 个 计数 带 就 会 被 重 置 。 这 可 能 导致 冷 踪迹 禾 盖 热 踪迹 信息 的 
情况 发 生 ， 结 果 就 违背 了 基于 踪迹 的 JIT ABT 

就 我 所 知 ， 在 基于 踪迹 的 JIT 中 没有 基于 方法 的 追踪 。 并 非 不 能 实现 ， 而 是 它 没有 太 大 的 用 
处 。 如 果 一 个 方法 有 热 循环 ,但 这 个 方法 本 身 只 被 调用 少数 几 次 ， 基 于 方法 的 追踪 可 能 无 法 发 现 
这 个 热 循环 并 编译 它 。 如 果 一 个 方法 只 是 因为 它 在 一 个 热 循环 中 被 调用 而 成 为 热 方法 , 那么 只 编 
译 这 个 函数 而 不 编译 循环 体 中 的 其 他 部 分 , 可 能 并 不 会 优化 这 个 循环 的 性 能 。 动态 语言 中 方法 的 
行为 主要 由 参数 类 型 决定 ， 因 此 基于 方法 的 追踪 可 能 有 用 。 但 在 这 种 情况 下 ，JIT 带 类 型 特 化 的 
基于 方法 编译 可 能 是 更 好 的 解决 方案 。 

截止 到 2015 年 , 所 有 知名 的 VM 都 不 再 使 用 基于 踪迹 的 IT, 主要 是 由 于 较 差 的 性 能 , 或 者 
提高 性 能 会 导致 的 极 高 设计 复杂 性 。 与 基于 方法 的 JIT 相 比 ， 节 省 编译 时 间 的 好 处 要 么 不 明显 ， 
要 人 么 很 多 情况 下 都 不 重要 。 运 行 时 类 型 特 化 和 数据 实例 化 带 来 的 性 能 收益 不 只 是 追踪 可 以 带 来 
的 ， 也 可 以 通过 类 型 推导 或 者 其 他 JIT 分 析 获 得 。 最 终 ， 对 全 面 发 据 潜 能 的 编译 带 来 说 ， 踪 迹 并 


不 是 合适 的 语义 单元 层级 。 


4.2.3 基于 区 域 的 JIT 

基于 区 域 的 JIT 可 以 看 作 基 于 方法 的 JIT 和 基于 踪迹 的 JIT 的 混合 。 编 译 单 元 可 以 是 一 个 基 
本 块 或 者 更 大 的 单元 , 但 不 需要 依赖 于 追踪 。 基 于 区 域 的 IT 就 像 是 一 个 更 小 粒度 的 基于 方法 的 
JIT， 它 仍然 可 以 利用 运行 时 信息 来 执行 类 型 特 化 和 数据 实例 化 。 

对 于 Java 这 样 的 静态 类 型 语言 , 基于 区 域 的 JIT 避免 编译 整个 方法 , 非常 有 利于 在 内 存 极 度 
有 限 的 平台 上 使 用 。 当 方法 太 大 或 者 需要 太 长 时 间 编 译 的 时 候 ， 基 于 区 域 的 JIT 也 很 有 用 。 可 以 
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把 这 个 方法 划分 为 几 个 区 域 ， 然 后 只 编译 选 定 的 区 域 。 在 某 种 程度 上 ,基于 区 域 的 编译 可 以 看 作 
外 联 (outlining ) 和 基于 方法 的 编译 的 组 合 。 外 联 是 一 种 编译 技术 ， 与 内 联 相 对 。 它 把 一 段 代 码 
移出 原来 的 方法 , 并 将 其 封装 为 一 个 新 方法 。 原 来 的 代码 被 替换 为 一 个 方法 调用 , 来 调用 新 方法 。 
新 方法 用 基于 方法 的 JIT 来 编译 。 

对 动态 语言 来 说 ， 基 于 区 域 的 JIT 可 以 在 避免 踪迹 爆炸 的 同时 应 用 类 型 特 化 。 实 现 这 一 点 靠 
的 是 基本 块 不 涉及 控制 流 的 事实 。 在 基本 块 层 级 的 编译 不 需要 处 理 任何 分 支 , 这 就 减少 了 出 现 编 
译 路 径 指数 增长 的 可 能 性 。 这 里 仍然 需要 守卫 检查 ， 用 于 类 型 特 化 和 数据 实例 化 。 

Facebook 的 PHP 语言 虚拟 机 ( HipHop virtual machine，HHVM ) 实现 了 基于 区 域 的 JIT。 它 
没有 采用 性 能 分 析 或 者 追踪 ,而 在 第 一 次 遇 到 基本 块 时 编译 它 , 使 用 编译 器 可 用 的 运行 时 类 型 进 
行 类 型 特 化 。HHVM 把 一 个 区 域 的 特 化 代码 称 为 “tracelet”。 在 编译 后 的 区 域 入 口 点 生成 守卫 代 
E, 确保 运行 时 输入 变量 的 类 型 满足 期 望 ; 否则 会 再 次 触发 编译 器 ,为 遇 到 的 新 输入 类 型 生成 一 
段 新 的 特 化 类 型 代码 。 它 把 同一 段 区域 的 不 同 特 化 类 型 的 编译 后 代码 连接 成 一 个 链表 , 与 运行 时 
实际 输入 类 型 进行 匹配 , 成功 匹 配 会 触发 踪迹 执行 。 在 链表 的 结尾 是 一 段 跳 转 代 码 , 用 来 在 链表 
内 找 不 到 匹配 的 踪迹 时 触发 新 的 踪迹 编译 。HHVM 把 这 个 区 域 的 多 个 踪迹 称 为 “平行 tracelet”。 
平行 tracelet 实际 上 把 守卫 代码 扩展 为 一 系列 条 件 分 支 ， 它 们 或 者 触发 一 个 匹配 的 tracelet HUT, 
或 者 匹配 失败 触发 tracelet 编译 。 

Dalvik VM 的 基于 踪迹 的 JIT 在 某 种 程度 上 也 可 以 看 作 基 于 区 域 的 JIT 


4.3 解释 器 与 JIT 编译 器 的 关系 


尽管 通常 解释 器 要 比 IT 慢 ， 它 仍然 广泛 应 用 于 VM 的 实现 。 解 释 器 有 一 些 优点 ， 比 如 更 低 
的 内 存 占用 ,以 及 更 短 的 应 用 程序 启动 时 间 。 但 这 些 都 不 是 根本 原因 。 在 使 用 解释 器 的 所 有 原因 
H, 最 主要 的 就 是 它 的 简单 性 。 当 出 现 一 个 新 语言 或 者 现 有 语言 出 现 一 个 新 特性 的 时 候 , 在 解释 
器 中 实现 比 在 JIT 编译 器 中 实现 要 快 得 多 。 使 用 解释 器 的 话 , 开发 者 用 VM 实现 语言 ( 比如 C 语 
A) 直接 实现 新 语言 特性 的 逻辑 。 换 句 话 说， 使 用 解释 器 对 开发 者 只 有 两 个 要 求 : 

(1) 熟悉 VM 实现 语言 ; 

(2) 理解 新 语言 特性 ， 包 括 语法 和 语义 。 

相 比 之 下 ， 要 在 JIT 编译 器 中 实现 新 语言 特性 ， 对 开发 者 有 更 多 的 要 求 : 

(1) 熟悉 目标 机 融 应 用 程序 二 进 制 接口 ( Application Binary Interface, ABI) 规范 ; 

(2) 熟练 掌握 把 新 语言 特性 映射 到 目标 机 器 ABI 的 运行 时 技术 ; 

(3) 熟练 掌握 开发 编译 器 以 生成 期 望 中 的 目标 机 器 码 的 技能 。 


因此 , 解释 器 可 以 帮助 开发 者 关注 于 新 语言 特性 , 加 速 开发 过 程 , 并 让 社区 更 快 接受 新 特性 。 
使 用 解释 器 的 男 一 个 重要 原因 是 , 考虑 到 性 价 比 ， 某 些 语言 特性 很 难 , 或 者 不 值得 实现 在 编 
译 器 中 ， 比 如 : 
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O 评估 字符 串 形 式 程序 的 eval () 图 数 ， 涉 及 VM INA; 

O 抛 出 一 个 异常 的 throw() 语 句 ， 需 要 展开 运行 时 栈 ， 因 此 涉及 VM 状态 反射 ; 

O 创建 一 个 新 对 象 的 new () 操作 符 ， 需 要 来 自 内 存 管理 器 的 支持 ， 因 此 可 能 触发 GC 

即使 在 最 完整 的 基于 编译 的 VM 中 , 这 些 特性 通常 也 是 实现 在 VM 的 运行 时 服务 之 上 的 , 需 
要 在 JIT 编译 的 代码 和 VM 代码 之 间 控 制 切换 。 通 常 VM 代码 和 JIT 编译 的 代码 有 不 同 的 执行 上 
下 文 ， 比 如 各 自 惯 例 下 的 不 同 栈 帧 布局 。 举 例 来 说 , E JIT 编译 代码 中 ， 栈 帧 支持 直接 方法 调用 
和 返回 ， 所 以 它 使 用 硬件 本 地 帧 指针 和 指令 指针 (〈 也 称 为 程序 计数 器 )， 比 如 X86 架构 的 bp 和 
ip 寄存 器 。 在 VM 代码 中 ,目标 程序 ( 比如 Java FAS ) 的 程序 计数 器 通常 保存 在 全 局 变量 中 ， 
并 指向 当前 运行 的 字 节 码 位 置 。VM 可 能 还 会 分 配 专门 的 内 存 区 域 用 于 保存 方法 栈 帧 。JIT 编译 
代码 和 VM 代码 之 间 的 控制 切换 可 能 还 需要 保存 和 恢复 执行 上 下 文 。 既 然 解 释 器 没有 JIT 编译 代 
码 , 那么 它 也 不 需要 JIT 编译 代码 的 执行 上 下 文 ， 它 是 VM 的 一 个 集成 部 分 。 在 解释 器 中 基于 运 
行 时 服务 实现 这 些 语言 特性 非常 简单 。 

尽管 解释 器 并 不 是 为 了 性 能 而 设计 的 ， 但 这 无 法 阻止 在 解释 器 中 使 用 编译 来 获得 更 高 性 能 。 
通常 向 解 释 器 引入 JIT 编译 器 有 两 种 正 交 的 方法 。 一 种 方法 是 在 解释 和 编译 之 间 来 回 切换 执 行 引 
擎 ， 然 后 对 热 代 人 码 应 用 JIT。 男 一 种 方法 是 把 应 用 程序 代码 编译 为 中 间 表 示 ( intermediate 
representation, IR )， 比 如 字 节 码 ， 然 后 解释 IR 代码 。 这 种 方法 的 好 处 在 于 IR 代码 的 恨 好 格式 ， 
使 得 解释 器 可 以 快速 分 发 。 这 种 方法 广泛 应 用 于 当前 基于 解释 器 的 VM 中 。 因 为 这 种 方法 不 会 生 
成 机 器 码 ， 所 以 可 以 灵活 定义 IR 的 语法 和 语义 ,在 编码 所 有 语言 特性 的 同时 ,仍然 保持 解释 器 
跨 人 硬件 平台 的 可 移植 性 。 


4.4 AOT 编译 


尽管 编译 有 助 于 提高 性 能 , 但 是 JIT 只 在 运行 时 工作 ,这 不 可 避免 地 增加 了 应 用 程序 执行 的 
运行 时 开销 。 提 前 (ahead-of-time, AOT ) 编译 试图 通过 在 执行 之 前 编译 应 用 程序 代码 来 尽 可 能 
降低 运行 时 开销 。 

所 有 传统 编译 器 都 是 在 应 用 程序 开发 阶段 采用 AOT 编译 。 而 对 于 通常 在 VM 中 运行 的 安全 
语言 应 用 程序 来 说 ， 很 少 在 开发 阶段 执行 AOT 编译 ， 因 为 这 可 能 或 多 或 少 地 损失 了 安全 语言 纺 
程 的 最 初 优势 。 如 果 没 有 额外 的 安全 手段 ， 那么 预先 编译 好 的 二 进 制 代码 几乎 无 法 保证 安全 性 ， 
也 无 法 用 单个 副本 跨 多 个 指令 集 架 构 ( ISA ) 运行 。 

AOT 编译 通常 在 应 用 程序 分 发 或 部 署 之 后 执行 。 例 如 ，OdinMonkey 是 asm.js 的 一 个 AOT 
编译 器 ， 由 Mozillla Firefox 开发 ， 作 为 SpiderMonkey 的 一 部 分 内 部 实现 。OdinMonkey 在 asm.js 
语言 加 载 到 浏览 器 之 后 , 以 及 被 应 用 程序 执行 之 前 编译 它 。 由 于 应 用 程序 在 加 载 到 浏览 器 之 前 并 
没有 编译 ， 它 仍然 保持 着 JavaScript 语言 安全 性 和 可 移植 性 的 优点 ,这 对 Web 应 用 程序 来 说 是 至 
关 重 要 的 。 
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asm.js 是 JavaScript 语言 的 一 个 子 集 ， 所 以 用 它 编写 的 应 用 程序 仍然 可 以 用 IonMonkey 即时 编 
译 ， 这 是 SpiderMonkey 中 一 个 基于 方法 的 JIT 实 现 。 区 别 在 于 ，asm.js 没有 像 动 态 类 型 、 异 常 抛 出 
和 GC 这 样 的 运行 时 特性 , 这 实际 上 使 得 asm.js 不 再 是 一 个 动态 语言 ,而 是 类 似 于 C 语言 这 样 可 以 
提前 编译 的 语言 。 一 个 事实 是 ，asm.js 代码 通常 是 由 C/C++ 程序 自动 生成 的 。LLVM clang 把 C/C++ 
代码 编译 为 LLVM 位 码 , 然后 Emscripten 把 位 码 翻译 为 asm.js 代码 。 所 以 asm.js 扮演 的 角色 更 像 
是 以 C/C++ 开发 的 中 间 语 言 , 用 于 Web 应 用 程序 的 部 署 。 目 前 asm.js 已 经 演化 为 Web Assembly. 

Google Chrome 的 可 移植 本 地 客户 端 (portable native client，PNaCl ) 技术 并 没有 使 用 asm.js 
作为 Web 应 用 程序 的 中 间 语 言 ， 相反 ， 它 把 C/C++ Web 应 用 程序 编译 为 LLVM 位 码 ， 然 后 直接 
以 位 码 形式 发 布 Web 应 用 程序 ， 最 后 在 加 载 到 Chrome 的 时 候 进行 AOT 编译 。 


与 之 相对 的 是 ,Google Chrome 的 NaCl 和 Microsoft Windows 的 ActiveX 技术 在 开发 时 把 Web 
应 用 程序 编译 为 本 地 二 进 制 机 咒 人 码 。 这 自然 导致 需要 根据 不 同 的 ISA 把 Web 应 用 程序 编译 为 多 
个 版 本 。 因 为 这 些 技术 没有 将 安全 语言 用 于 应 用 程序 发 布 ， 所 以 它们 不 得 不 提供 其 他 安全 手段 ， 
比如 Chrome 为 NaCl 代码 提供 的 沙 盒 ， 以 及 Windows 为 ActiveX 代码 提供 的 数字 签名 。 

除了 可 移植 性 和 安全 性 这 些 优点 ， 不 在 编译 时 执行 AOT 编译 通常 还 有 一 个 深层 原因 : 安全 
语言 的 动态 特性 导致 用 AOT 编译 完整 编译 一 个 应 用 程序 可 能 非常 具有 挑战 性 。 像 反射 、eval () 
图 数 、 动 态 类 加 载 、 动 态 类 型 和 GC 这 样 的 动态 特性 ， 使 得 一 些 应 用 程序 信息 只 在 运行 时 可 得 ， 
而 完成 AOT 编译 需要 这 些 信息 。 

举例 来 说 ， 安 全 语言 通常 不 指定 对 象 的 物理 布局 ， 这 是 由 GC 运行 时 自行 决定 的 。 当 AOT 
编译 器 编译 与 对 象 字段 或 属性 相关 的 表达 式 时 , 它 甚 至 不 知道 这 个 对 象 数据 在 内 存 中 是 连续 的 还 
是 分 散 的 。 如 果 不 能 获得 对 象 布 局 信息 的 话 ， 它 就 没有 办 法 为 对 象 数据 访问 生成 本 地 指令 ， 除非 
通过 速度 慢 得 多 的 反射 支持 。JIT 编译 需 则 没有 这 样 的 问题 ， 因 为 在 它 生 成 指令 的 时 候 ， 可 以 在 
运行 时 从 VM 和 GC 获得 所 有 信息 。 

动态 类 加 载 也 增加 了 AOT 编译 的 难度 。 如 果 在 AOT 编译 时 一 个 类 还 没有 加 载 , 就 无 法 编译 
它 的 方法 。 动 态 类 型 也 与 之 类 似 ， 它 允许 变量 的 类 型 在 运行 时 动态 改变 。 如 果 AOT 编译 器 不 能 
推 新 出 变量 类 型 ， 那 么 就 没有 什么 简单 的 办 法 可 以 为 这 个 变量 的 操作 生成 高 效 代码 。 

针对 这 些 问 题 ，AOT 编译 器 通常 会 生成 代码 来 链接 到 一 些 动态 库 ， 以 此 把 这 些 问 题 推 迟到 
运行 时 。 一 个 极端 的 解决 方案 是 把 整个 运行 时 系统 和 应 用 程序 代码 编译 到 一 起 ， 这 实际 上 是 把 
VM 绑 定 到 了 应 用 程序 发 布 包 。 这 是 目前 发 布 HTML5 应 用 程序 的 一 种 典型 方案 。 它 并 没有 真正 
提前 编译 应 用 程序 。 

为 了 简化 AOT 编译 ， 一 种 很 常见 的 方法 是 在 伪 运 行 时 状态 下 执行 编译 。 也 就 是 说 ， 尽 可 能 
多 设置 运行 时 状态 ， 同 时 又 避免 真正 的 代码 运行 。 例 如 ，AOT 编译 器 可 能 会 加 载 所 有 需要 的 类 ， 
并 从 目标 VM 中 得 到 对 象 布局 信息 。 或 者 AOT 编译 顺 可 以 在 VM 启动 之 后 以 及 任何 代码 执行 之 
前 执行 。 如 果 VM 启动 的 目的 就 是 辅助 AOT 编译 ， 那 就 可 以 在 编译 结束 后 关闭 VM。 在 伪 运 行 
时 AOT 编译 中 ， 不 应 该 向 系统 提交 应 用 程序 执行 结果 。 
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还 有 一 种 AOT 解决 方案 是 只 编译 能 够 编译 的 代码 ， 把 不 可 编译 的 部 分 留 给 运行 时 。 
Firefox OdinMonkey 可 以 为 asm.js 代码 执行 AOT 编译 ， 因 为 asm.js 实际 上 去 除了 JavaScript 
的 所 有 动态 特性 。Android 应 用 程序 的 中 间 语 言 dexcode 保持 了 Java 字 节 但 的 一 些 动态 特性 ， 
Android 运行 时 (ART ) 需要 在 伪 运 行 时 状态 下 对 dexcode 执行 AOT 编译 。 为 了 确定 需要 编译 哪 
I, ART 需要 加 载 所 有 需要 的 类 ， 因 此 在 AOT 编译 过 程 中 ， 用 一 个 内 建 解释 需 执 行 了 这 些 类 
的 初始 化 。 换 名 话说 ，AOT 编译 紫 几 乎 涉及 一 个 完整 的 VM。 
既然 有 些 AOT 编译 器 需要 执行 应 用 程序 代码 , 那么 讨论 一 下 JIT 编译 和 AOT 编译 的 界限 还 
是 比较 有 趣 的 。 它 们 的 区 别 如 下 。 
(1) AOT 编译 的 执行 通常 不 会 真正 运行 应 用 程序 或 者 提交 执行 结果 。 换 名 话说 ， 应 用 程序 不 
是 处 于 “运行 时 ”状态 。AOT 可 能 执行 应 用 程序 的 某 些 代码 ,但 这 只 是 为 了 AOT 编译 
可 能 实现 而 做 出 的 妥协 ， 而 不 是 为 了 获得 作为 应 用 程序 开发 目的 的 执行 结果 。 
(2) AOT 编译 不 能 完全 确定 它 编译 的 方法 是 否 会 在 应 用 程序 的 实际 运行 中 执行 ， 因 为 它 并 没 
有 关于 控制 流 的 所 有 运行 时 信息 。AOT 可 能 采用 一 些 启 发 式 方法 或 者 性 能 分 析 信 息 ， 以 
辅助 方法 选择 。 相 比 之 下 ，JIT 只 编译 确定 会 执行 的 方法 。 
(3) AOT 编译 和 应 用 程序 执行 是 两 个 严格 区 分 的 阶段 。 这 两 个 阶段 不 会 交 蕉 ， 在 时 间 和 空间 
上 都 可 以 分 开 , 换 句 话说 , 如 果 需 要 的 话 , AOT 编译 阶段 可 以 在 一 个 地 方 保存 编译 结果 ， 
然后 执行 阶段 可 以 在 另 一 个 地 方 使 用 这 个 结果 ， 不 需要 再 次 编译 。 根 据 VM、 语 言 和 应 
用 程序 的 设计 ，AOT 编译 可 以 在 应 用 程序 开发 、 部 署 、 安 装 和 启动 等 时 刻 运 行 。 
采用 AOT 编译 的 主要 动因 是 为 了 节省 JIT 编译 在 时 间 和 空间 方面 的 运行 时 开销 ， 同 时 又 保 
持 相 对 于 解释 器 的 性 能 优势 . 但 是 由 于 AOT 的 非 运行 时 特性 , AOT 可 能 无 法 实现 JIT 可 用 的 所 有 
优化 。 例 如 , 动态 语言 的 类 型 特 化 需要 编译 器 了 解 变 量 的 运行 时 类 型 ， 而 这 在 AOT 中 通常 是 无 法 
获得 的 。 另 一 个 例子 是 关于 运行 时 安全 增强 。JVM 要 求 确保 对 数组 元 素 的 访问 一 直 在 数组 边界 内 ， 
所 以 在 任何 数组 元 素 访问 之 前 都 会 进行 数组 边界 检查 。 如 果 编 译 器 确定 访问 一 直 在 数组 边界 内 ， 
它 可 能 会 去 掉 多 余 的 边界 检查 。 通 常 在 JIT 时 比 在 AOT 时 更 容易 获得 元 素 索 引 和 数组 长 度 。 
然而 ，AOT 编译 能 够 采用 一 些 重量 级 优化 ， 这 种 优化 手段 由 于 运行 时 开销 过 大 而 通常 不 用 
于 JIT。 应 用 程序 执行 过 程 中 ， 太 长 的 JIT 编译 时 间 可 能 导致 应 用 程序 执行 时 出 现 用 户 能 够 感知 
到 的 卡 顿 , 所 以 有 时 它 需 要 平衡 编译 时 间 和 执行 时 间 。AOT 可 能 就 不 需要 这 种 权衡 。 因 此 , AOT 
可 以 应 用 像 过程 间 优化 和 全 应 用 程序 逃逸 分 析 这 样 的 优化 ， 这 些 通常 在 JIT 中 不 会 完整 应 用 。 
尽管 所 有 的 传统 静态 编译 都 可 以 看 作 AOT 编译 ,但 通常 不 这 么 称呼 。 当 明确 指出 时 ，AOT 
编译 通常 被 认为 是 JIT 的 一 种 特殊 形式 ， 是 一 种 动态 编译 而 非 静 态 编译 方式 。 


4.5 编译 时 与 运行 时 


编译 时 是 指 编译 器 编译 的 时 刻 。 运 行 时 是 指 应 用 程序 运行 的 时 刻 。 传 统 上 ， 二 者 是 解 耘 的 ， 
而 在 基于 JIT 的 VM 中 二 者 是 交 春 的 ， 因 为 JIT 在 运行 时 编译 。 对 这 些 术语 更 好 的 定义 应 该 揭示 
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这 些 阶 段 的 主语 和 宾语 之 间 的 联系 。 

假定 用 上 工 语言 编写 的 程序 P 编译 为 机 器 码 C， 编 译 时 指 的 是 程序 P 从 工 编 译 到 C 的 时 段 ， 
而 运行 时 指 的 是 程序 P 以 C 的 形式 执行 的 时 段 。 

在 VM 中 有 两 种 不 同 的 运行 时 。 一 种 是 程序 执行 的 时 候 ， 即 程序 运行 时 ,也 称 为 应 用 程序 运 
行 时 ， 或 者 简称 为 运行 时 。 另 一 种 是 编译 代码 C 执行 的 时 候 ， 即 编译 代码 运行 时 。 当 VM 启动 
运行 程序 P 的 时 候 ， 它 进入 应 用 程序 运行 时 状态 ,但 不 一 定 运行 任何 编译 代码 C。 当 应 用 程序 代 
For L 编译 到 C 的 时 候 ， 它 处 于 编译 时 状态 。 代 码 编译 时 和 代码 运行 时 都 发 生 在 应 用 程序 运行 
时 。 图 4-3 阐释 了 这 种 关系 。 


N 
1 、 
程序 P 的 运行 时 
代码 M 的 编译 时 代码 M 的 运行 时 
E e 





图 4-3 VM 中 编译 时 和 运行 时 的 关系 


对 VM 开发 者 来 说 ， 编 译 时 和 运行 时 的 区 别 很 重要 ,因为 这 决定 哪些 是 可 用 的 , 哪些 可 能 发 
生 , 以 及 可 能 在 什么 时 候 发 生 。 举 例 来 说 , E JVM 中 ,一 个 ovar 对 象 被 创建 后 , 它 的 方法 foo () 
第 一 次 被 调用 的 时 候 ,会 触发 JIT 对 foo () 方 法 进行 编译 。 在 foo ( ) 方 法 中 ,有 一 个 对 ovar.data 
的 对 象 字段 访问 ， 如 以 下 代码 所 示 。 
int Local = svar-data; 
JIT 可 能 看 到 如 下 的 相应 字 节 码 。 


getfield 2 // 从 对 象 中 加 载 字 段 #2 “data” 
istore_4 // 把 值 保存 在 局 部 变量 中 


当 JIT 生成 本 地 机 器 码 的 时 候 ， 这 个 对 象 已 经 创建 ，JIT 可 以 在 编译 字 节 码 的 时 候 获 得 它 的 
地 址 ， 比 如 0x00abcq00。 但 是 JIT 不 应 该 为 getfielq 2 生成 下 面 这 样 的 代码 。 


// 假定 “data” 字 段位 于 从 对 象 起 始 地 址 偏 移 0x10 的 位 置 ， 
// 即位 于 0x00abcd10， 
// 因为 有 0x00abcd10 = 0x00abcd00 + 0x10 


movl Ox00abcd10, %eax // #2 “data” AEAF] eax, #! 
movl %eax, $16(%esp) // 复制 eax 值 到 局 部 栈 


这 段 代 码 直接 在 0x00abcd10 访问 ovar .data， 这 是 不 正确 的 。 原 因 如 下 。 
(1) 尽管 ovar 对 象 的 地 址 在 字 节 码 编译 时 是 0x00abcd00, 在 编译 后 代码 执行 时 这 个 地 址 
可 能 有 所 不 同 ， 因 为 这 个 对 象 可 能 会 被 垃圾 回收 器 移动 。 
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(2) 尽管 fco () 方 法 被 编译 是 由 于 在 ovar 对 象 上 的 调用 ，ovar 是 某 个 类 ( 比如 kclass ) 
的 一 个 实例 ， 但 是 这 个 类 可 能 会 创建 其 他 实例 。foo () 方 法 也 可 能 在 这 些 其 他 实例 上 被 
调用 。 不 同 的 实例 ， 地 址 也 不 同 。 


实际 上 , 尽管 ovar 是 触发 foo ( ) 编译 的 对 象 , 但 它 可 能 甚至 不 是 第 一 个 调用 foo () 编译 后 
代码 的 对 象 。 在 多 线程 应 用 程序 中 ， 另 外 一 个 线程 可 能 就 在 编译 后 代码 地 址 安装 到 kclass 的 
vtable 之 后 ， 以 及 触发 编译 的 线程 开始 运行 foo ( ) 的 编译 后 代码 之 前 调用 foo () 。 所 以 ,正确 的 
生成 代码 序列 应 如 下 所 示 。 

// BR ovar 保存 在 从 栈 顶 偏 移 0x20 的 位 置 (保存 在 寄存 器 esp 中) 

movl $0x20(%esp), %eax // 复制 “ovar” 到 eax 


movl $0x10(%eax), eax // 复制 “ovar .data” 到 eax 
movl %eax, $16(%esp) // 复制 eax 值 到 局 部 栈 


一 个 例子 是 调用 ovar 对 象 的 虚 方 法 ， 比 如 : 
ovar.foo(); 
对 应 的 字 节 码 序 列 可 能 如 下 所 示 。 
aload_0 // mÅ ovar BRE 
invokevirtual #16 // 调用 ovar.foo() 
在 编译 时 ,JIT 知道 当前 对 象 ovar 的 类 kclass 的 vtable 地 址 ( 比如 0x00001000 )。 在 vtable 
的 已 知 偏 移 量 ( 比如 0x10 ), JIT 可 以 找到 foo () WAFS (比如 0x00002000 )。 但 即使 编译 后 
代码 不 会 移动 , JIT 也 不 能 生成 像 下 面 这 样 直 接 调用 入 口 点 的 指令 。 
call 0x00002000 // 调用 kclass 的 方法 foo() 
原因 在 于 ， 运 行 时 ovar 指向 的 实际 对 象 可 能 是 kclass 的 一 个 子 类 实例 ， 比 如 sclass, 
而 sclass 可 能 覆盖 了 kclass 的 方法 foo () 。 这 意味 着 ，JIT 在 编译 时 了 解 的 foo () 可 能 不 是 
在 运行 时 实际 调用 的 foo () 。 所 以 正确 的 生成 代码 应 该 试图 从 ovar 对 象 的 vtable 确定 正确 的 方 
法 ， 如 以 下 代码 所 示 。 


movl $0x20(%esp), %eax // 复制 “ovar” 到 eax 
movl (%eax), %eax // 加 载 vtable 指针 到 eax 
movl $0x10(%eax), %eax // 加 载 foo() 的 入 口 点 
call %eax // 调用 ovar.foo() 


在 方法 编译 时 可 以 使 用 某 些 应 用 程序 运行 时 信息 。 比 如 ， 正 如 我 们 已 经 看 到 的 ，JVM 中 一 
个 方法 在 vtable 中 的 偏 移 量 ， 在 编译 时 是 可 用 的 。JIT 不 需要 在 每 次 调用 方法 时 都 生成 指令 来 获 
取 这 个 偶 移 量 ， 如 下 所 示 。 


pushl $16 // 方法 索引 压 栈 

pushl $0x20(%esp) // “ovar” FER 

call get_vtable_offset // foo() 的 偏 移 在 eax 中 
movl $0x20(%esp), %ebx // 复制 “ovar” 到 ebx 

movl (%ebx), %ebx // 加 载 Vtable 指针 到 ebx 
addl %ebx, %eax // eax 现在 持 有 foo () HAV 
call %eax // 调用 ovar.foo() 
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在 JVM 中 , 一旦 一 个 类 已 经 加 载 ， 在 整个 应 用 程序 运行 过 程 中 ， 某 个 方法 在 vtable 中 的 偏 
移 就 是 固定 的 ， 所 以 在 方法 编译 时 JIT 可 以 使 用 这 个 偏 移 ， 这 不 会 在 方法 运行 时 引起 任何 问题 。 

注意 ， 对 于 不 同 的 语言 ,编译 时 或 运行 时 可 用 的 信息 也 是 不 同 的 。 在 某 些 动态 语言 中 ， 可 以 
在 运行 时 增加 或 删除 对 象 属性 ( 或 字段 )， 所 以 通常 不 可 能 在 编译 时 确定 这 些 属 性 的 固定 位 置 。 
例如 ， 在 JavaScript 中 ， 经 常 使 用 一 个 散 列 表 把 属性 名 称 映 射 到 值 。 这 种 情况 下 ， 对 属性 的 访问 
函数 必须 在 运行 时 被 调用 以 获得 这 些 值 。 

编译 时 和 运行 时 的 界限 并 不 像 图 4-3 中 所 展示 的 那么 清晰 。 这 里 的 微妙 之 处 在 于 ,这 两 个 阶 
役 经 常 是 交合 的 。 比 如 ， 为 了 编译 一 个 方法 ( 当 这 个 方法 在 编译 中 )， 编 译 絮 可 能 不 得 不 执行 为 
外 一 个 方法 ( 比如 类 初始 化 ) 才能 完成 对 这 个 方法 的 编译 。 

另 一 方面 ， 当 一 个 方法 的 编译 后 代码 执行 的 时 候 ， 可 能 会 调用 另 一 个 方法 ,并 因此 触发 这 个 
方法 的 JIT 编译 。 所 以 经 常 能 看 到 方法 A 的 编译 触发 方法 B 的 执行 ， 然 后 又 触发 方法 C 的 编译 ， 
接着 又 触发 方法 D 的 编译 ， 等 等 。 因 此 ，VM 的 运行 时 栈 可 能 交 秋 着 编译 帧 和 执行 帧 。 

在 纯粹 基于 解释 器 的 VM 中 , 可 以 说 没有 编译 时 , 因此 程序 运行 时 与 编译 后 代码 运行 时 没有 
区 别 。VM 的 整个 生命 周期 就 是 执行 应 用 程序 代码 ， 因 此 都 处 于 运行 时 。 这 是 VM 也 被 称 为 运行 
时 系统 的 一 个 原因 。 


Po ANOT 





安全 语言 并 不 向 程序 员 提供 直接 的 内 存 管 理应 用 程序 接口 ( API ), 而 是 把 这 个 任务 委托 给 虚 
拟 机 VM )。 程序 员 只 要 按照 需求 创建 对 象 即 可 ,无须 操心 对 象 分 配 在 哪里 ， 以 及 对 象 数 据 如 何 
布局 。 此 外 , 程序 员 不 需要 监管 对 象 的 生存 期 ， 也 不 需要 在 对 象 对 程序 已 经 无 用 的 时 候 释放 其 占 
用 的 内 存 。 

HS NH CGC ) 是 为 程序 员 执 行 所 有 动态 数据 管理 工作 的 VM 组 件 。 "垃圾 回收 需 ” 这 个 
名 称 并 不 十 分 准确 ， 因 为 它 所 做 的 不 只 是 回收 无 用 对 象 ( 也 就 是 垃圾 )。 回 收 总 是 和 重用 联系 在 
一 起 的 。 一 旦 垃圾 回收 算法 设计 好 ,把 回收 的 空间 重用 于 对 象 分 配 的 方式 也 就 大 致 确定 了 , 反之 
亦 然 。 所 以 比 起 “垃圾 回收 ”"， 有 些 开 发 者 更 喜欢 使 用 “自动 内 存 管理 ”这 个 名 称 。 

垃圾 回收 的 关键 点 是 确定 对 象 的 生存 期 ， 也 就 是 何 时 可 以 回收 对 象 。 


5.1 对 象 生存 期 


当 一 个 对 象 对 程序 不 再 有 用 的 时 候 ， 它 就 死亡 了 ， 于 是 可 以 被 回收 。 这 是 一 个 循环 定义 , 但 
它 确实 强调 了 何 时 可 以 回收 一 个 对 象 。“ 对 象 对 程序 有 用 ”意味 着 这 个 对 象 将 在 未 来 某 个 时 刻 被 
程序 访问 。 
传统 静态 编译 器 通过 “活性 分 析 ” 算 法 确定 一 个 变量 的 生存 期 ,以 此 辅助 像 寄存 器 分 配 这 样 
的 优化 。 如 果 一 个 变量 持 有 一 个 可 能 在 将 来 被 用 到 的 值 , 那么 编译 器 认为 这 个 变量 是 活跃 的 。 生 
存 期 范围 从 对 变量 的 一 次 写 操作 开始 , 直到 对 这 个 被 写 入 值 的 最 后 一 次 读 取 结束 。 对 象 的 活性 最 
终 可 以 用 类 似 的 方法 定义 。 对 一 个 对 象 来 说 ， 如 果 它 的 数据 可 能 在 未 来 被 读 取 ， 那么 这 个 对 象 就 
被 认为 是 活着 的 。 对 象 生存 期 管理 与 变量 活性 分 析 的 区 别 如 下 。 
(1) 如 果 没 有 过 程 间 分 析 的 话 ， 活 性 分 析 只 分 析 “ 方 法 内 ”局 部 变量 的 活跃 范围 。 相 比 之 下 ， 
对 象 可 以 “ 跨 方法 ”传递 ， 这 种 情况 很 常见 ， 很 难 使 用 传统 活性 分 析 方 法 来 分 析 。 
(2) 活性 分 析 提 供 的 活跃 信息 “可 能 ”为 真 。 即 使 它 不 真实 ， 也 不 会 引发 错误 ， 只 是 这 个 变 
量 留存 的 时 间 会 长 于 所 需 时 间 。 而 GC 的 死亡 信息 “必须 ”正确 ; 否则 ， 如 果 活 跃 对 象 
被 回收 ,程序 就 可 能 出 错 。 
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(3) 即使 采用 过 程 间 分 析 ， 活 性 分 析 也 几乎 无 法 处 理 复杂 程序 逻辑 ， 特 别 是 对 于 信息 无 法 静 
态 获取 的 动态 程序 行为 ， 比 如 异常 抛 出 和 虚 方法 调用 。 

由 于 前 面 提 到 的 原因 , 传统 活性 分 析 在 对 象 生存 期 管理 中 的 适用 性 非常 有 限 。 要 找到 活跃 对 
象 ， 动 态 分 析 方 法 更 适合 ， 像 引用 计数 (reference counting, RC ) 和 对 象 追踪 这 样 的 技术 都 可 以 
用 到 。 不过， 活性 分 析 仍 然 有 用 。 比 如 ， 在 编译 器 搬 桩 (instrument ) 代码 的 时 候 ， 它 可 以 用 在 
RC 中 ，5.2 节 会 介绍 这 一 点 。 它 还 可 以 在 逃逸 分 析 中 用 来 识别 方法 局 部 对 象 。 方法 局 部 对 象 只 在 
方法 内 部 活动 (也 就 是 不 会 从 方法 中 逃逸 )， 因 此 可 以 把 它们 当 作 局 部 变量 管理 ， 在 方法 的 栈 帧 
上 分 配 。 这 种 情况 不 是 GC 的 主要 目的 所 在 ,我 们 把 它 留 到 以 后 讨论 。GC 需要 处 理 的 常见 情况 
是 对 象 跨 方法 甚至 跨 线程 活跃 的 情况 。 


5.2 引用 计数 
一 个 对 象 什么 时 候 对 应 用 程序 不 再 有 用 ,具体 的 时 间 点 很 难 精确 地 掌握 ,因为 这 需要 预测 程 


序 失去 了 对 一 个 对 象 的 引用 , 那么 它 就 没有 办 法 再 去 访问 这 个 对 象 , 因此 对 应 用 程序 来 说 ， 这 个 
对 象 一 定 是 不 再 有 用 了 。 

一 个 对 象 可 能 在 应 用 程序 失去 对 它 的 所 有 引用 之 前 就 变 得 无 用 。 换 名 话说 ,对象 可 达 性 比 对 
象 有 用 性 更 保守 一 些 , 这 就 意味 着 对 象 回收 会 晚 于 它 能 够 被 回收 的 时 刻 , 但 这 是 回收 及 时 性 和 分 
析 复 杂 度 之 间 的 一 个 合理 妥协 。 

要 确定 应 用 程序 是 否 还 持 有 一 个 对 象 的 任何 引用 ,很 直观 的 思路 就 是 使 用 RC 技术 ,其 思路 
就 是 把 每 个 对 象 的 引用 数目 记录 在 一 个 计数 器 中 。 每 当 系 统 中 安装 对 这 个 对 象 的 一 个 新 引用 , 比 
如 写 入 内 存 、 加 载 到 栈 上 、 或 者 保存 在 一 个 寄存 器 中 时 ， 就 递增 计数 融 。 当 现 有 引用 被 其 他 值 覆 
盖 的 时 候 ， 就 递减 计数 需 。 

当 计 数 器 归 零 的 时 候 ,， 这 个 对 象 就 是 不 可 达 的 ,然后 这 个 对 象 就 可 以 被 回收 了 。 当 回收 一 个 
对 象 S 的 时 候 ，S 引用 的 所 有 其 他 对 象 也 都 要 递减 各 自 的 引用 计数 需 。 如 果 其 中 任何 一 个 计数 需 
EH, 那么 相应 的 对 象 也 应 该 被 回收 。 这 个 过 程 需要 持续 传递 ， 直 到 不 再 有 新 的 对 象 变 为 不 可 

在 一 个 简单 实现 中 , 需要 表 5-1 中 的 原 语 来 完成 RC 操作 。 根据 上 下 文 的 不 同 ,， RC 可 以 表示 
引用 数 ( reference count ) 或 者 引用 计数 (reference counting )。 





表 5-1 引用 计数 原 语 


操 作 码 操 F 数 语 X 
incRC obj! 对 象 objl 的 RC 递增 
decRC objl 对 象 objl 的 RC 递减 


testRC objl 测试 对 象 objl 的 RC 是 否 降 为 0， 如 果 是 的 话 , 回收 它 并 且 递 归 更 新 
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表 5-2 给 出 了 一 些 使 得 实现 更 便捷 的 补充 原 语 。 
表 5-2 引用 计数 补充 原 语 


操 作 码 操 作 数 语 X 
dectestRC objl decRC 然后 testRC 
updSlot obj 1, obj2 incRC obj2 并 dectestRC objl 


RC Jerid FF FH aE AE BIE SE, aE aE 22 at — TOE BK. TESS — ib 
WP, BESTS SUPE HERE AG ASSAY ERR, 有些 引 用 保存 在 堆 和 栈 之 外 。 对 它 
们 的 写 和 信也 需要 插 桩 。 比 如 ， 类 的 静态 字段 可 能 分 配 在 独立 的 内 存 空 间 中 ， 其 中 可 能 包含 引用 。 
这 里 用 堆 和 栈 代表 根据 VM 语义 所 有 引用 可 能 写 入 的 空间 )， 编 译 器 执行 以 下 操作 。 

口 每 当 对 象 objl 有 引用 加 载 到 栈 上 时 ， 为 它 插入 incRC。 

口 每 当 一 个 对 象 的 包含 值 objl 的 字段 被 重 写 为 值 obj2 时 ， 为 它 插入 updSlot。 

编译 需 不 会 搬 桩 用 作 方 法 参数 或 者 返回 值 的 引用 ,因为 参数 会 被 调用 方 的 栈 帧 持 有 ， 而 当前 
方法 返回 的 时 候 ， 返 回 值 也 会 出 现在 调用 方 的 上 下 文中 。 

在 第 二 趟 扫描 中 ,编译 髓 对 在 第 一 趟 扫描 中 插 桩 了 incRC 或 者 updSlot 的 对 象 执 行 活性 分 析 ， 
然后 执行 以 下 操作 。 

口 在 它们 的 活跃 范围 终点 ， 也 就 是 它们 的 引用 刚刚 结束 最 后 一 次 使 用 的 位 置 ， 插 入 

dectestRC 来 递减 它们 的 RC， 如 果 它 们 的 RC 降 到 零 就 回收 这 些 对 象 。 如 果 活 路 范围 在 
return 语句 结束 ， 就 用 decRC 代替 dectestRC， 因 为 如 果 向 调用 方 返 回 对 象 引 用 ， 那么 可 
以 确定 这 个 对 象 的 RC 一 定 不 为 零 。 

TE JVM 的 RC 实现 中 , 可 能 通过 Java 本 地 接口 (JNI) 在 Java 代码 和 本 地 代码 之 间 传 递 对 象 。 
这 些 对 象 也 需要 在 本 地 代码 中 更 新 它们 的 RC。 我 们 需要 插 桩 下 面 这 些 INI 相关 操作 : 设 定 一 个 
引用 类 型 字段 , 设 定 一 个 引用 类 型 静态 字段 , 对 象 克隆 , 以 及 数组 克隆 。 在 模块 化 良好 的 实现 中 ， 
比如 Apache Harmony， 只 需要 修改 4 个 也 数 。 

RC 操作 可 能 带 来 巨大 的 运行 时 开销 。 这 些 操 作 中 很 多 是 可 以 被 消除 的 元 余 操 作 。 例 如 ， 同 
一 个 对 象 上 一 对 相连 的 incRC 和 dectestRC, 可 以 替换 为 一 个 testRC 来 捕捉 可 能 的 零 RC。 因为 对 
同一 个 对 象 的 引用 可 能 来 自 不 同 的 变量 ， 所 以 可 以 应 用 别名 分 析 帮 助 判断 它们 是 否 指 向 同一 对 
象 ， 以 便于 应 用 优化 。 

要 实现 RC 算法 ,一 个 问题 是 把 每 个 对 象 的 引用 计数 器 放置 在 何 处 。 计 数 器 值 不 能 太 小 ， 以 
至 于 不 能 记录 大 数值 ; 也 不 能 太 大 , 以 至 于 带 来 巨大 的 内 存 开销 。 根据 目标 应 用 程序 的 不 同 特性 ， 
它 可 以 是 1 个 字 节 、2 个 字 节 ， 甚 至 是 4 个 字 节 。 如 果 RC 值 溢出 计数 器 存储 ，VM 就 不 得 不 放 
弃 追 踪 ， 并 认为 这 个 对 象 永远 活跃 ,或 者 使 用 其 他 GC 算法 来 回收 它 。 

计数 器 最 小 可 以 是 1 位 。 值 “1” 意 味 着 它 被 引用 过 一 次 。 当 这 个 对 象 被 创建 ， 并且 它 的 引 
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用 被 安装 到 系统 中 之 后 ,这 一 点 就 成 立 了 。 一 旦 失去 了 这 个 单独 引用 ,这 个 对 象 就 会 被 回收 。 如 
果 它 有 多 个 引用 ,这 个 计数 器 就 会 溢出 ,这 个 对 象 就 会 永远 生存 。 如 果 应 用 程序 的 多 数 对 象 都 只 
有 一 个 引用 的 话 ， 那 么 这 样 设计 有 时 候 是 合理 的 。 

紧 接 着 的 一 个 问题 就 是 , 在 多 线程 应 用 程序 中 如 何 更 新 计数 器 。 递 增 和 递减 操作 本 质 上 都 是 
读 - 修 改 - 写 操作 。 如果 不 使 用 原子 化 控制 , 两 个 线程 对 同一 个 计数 器 的 同时 操作 就 可 能 导致 不 正 
确 的 值 。 有 些 GC 选择 使 用 原子 操作 来 递增 和 递减 。 这 样 的 设计 中 ,“ 递 减 并 测试 ”并 不 一 定 要 
是 原子 的 ， 因 为 计数 带 一 旦 归 零 就 无 法 改变 。 

对 于 多 数 已 知 处 理 器 来 说 ， 原 子 指令 都 是 代价 昂贵 的 。RC 算法 可 以 选择 不 使 用 原子 RC 更 
新 。 这 样 做 的 代价 是 ， 如 果 某 个 对 象 被 第 二 个 线程 引用 的 话 ， 那 么 就 放弃 RC 8 追踪， 让 它 变 成 
永存 的 。 为 了 实现 这 一 点 ， 需 要 额外 的 位 来 记录 它 创建 线程 的 ID。 当 一 个 线程 试图 更 新 一 个 对 
象 的 RC 时 ， 它 总 是 测试 保存 的 线程 ID 是 否 和 它 自己 的 ID 相同 。 如 果 相 同 的 话 ， 这 个 线程 就 
继续 RC 更新; 和 否则， 就 把 RC 设 为 溢出 。 如 果 多 数 对 象 都 是 线程 局 部 对 象 的 话 ， 这 个 方法 非常 
有 用 。 

除了 运行 时 开销 较 高 ，RC GC 的 主要 缺点 是 循环 引用 问题 ， 其 中 的 对 象形 成 了 引用 环 。 一 
个 极端 的 例子 是 自 指 引用 。 这 种 情况 下 , 即使 是 当 应 用 程序 已 经 无 法 到 达 环 中 任何 一 个 对 象 的 时 
候 ， 环 中 对 象 的 RC 也 永远 无 法 归 零 。 它 们 成 为 无 法 回收 的 “漂浮 垃圾 ”。 

为 了 避免 或 者 修正 引用 环 ， 社 区 已 经 提出 了 各 种 技术 。 比 如 ，Apple 为 引用 使 用 “weak” 或 
者 “unowned” 修 饰 符 ， 用 来 向 Swift 运行 时 系统 指示 在 RC 算法 中 不 要 为 这 个 引用 计数 。 

在 生成 代码 中 插入 RC 操作 增加 了 代码 量 。 这 可 能 导致 更 多 指令 缓存 失效 。 在 内 存 较 小 的 系 
统 中 ， 代 码 膨 胀 可 能 严重 到 足以 使 得 RC 算法 失效 或 者 无 法 应 用 。 解 释 器 则 不 会 有 这 个 问题 。 
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RC 的 根本 问题 存在 于 它 的 设计 本 质 之 中 。 它 试图 追踪 引用 数目 来 确定 对 象 的 活性 ， 但 是 只 
有 来 自 应 用 程序 的 引用 才能 给 出 这 个 对 象 的 可 达 性 , 当 指 向 对 象 $ 的 一 个 引用 安装 到 对 象 T 中 时 ， 
这 只 意味 着 对 象 S 被 对 象 工 所 引用 ， 而 不 是 对 象 S 被 应 用 程序 所 引用 。 

前 面 已 经 提 到 ， 我 们 使 用 “对 象 可 达 性 ”来 作为 “对 象 有 用 性 ”的 近似 。 非 零 RC 不 一 定 意 
味 着 这 个 对 象 对 于 应 用 程序 是 可 达 的 。 只 有 当 对 象 由 应 用 程序 直接 或 间接 引用 时 , 才 可 以 认为 它 
是 可 达 的 。 

如 果 一 个 对 象 由 应 用 程序 直接 引用 , 那么 它 的 引用 必须 安装 在 应 用 程序 的 执行 上 下 文中 , 包 
括 栈 帧 、 寄 存 器 和 全 局 变量 。 应 用 程序 可 以 通过 它们 的 名 字 或 者 地 址 直接 访问 这 些 位 置 。 保 存在 
这 些 位 置 的 对 象 引 用 称 为 “ 根 ” 引 用 。 

如 果 一 个 对 象 由 应 用 程序 间接 引用 , 它 的 引用 没有 安装 在 应 用 程序 的 执行 上 下 文中 , 而 是 安 
装 在 其 他 可 达 对 象 中 。 所 以 可 达 性 是 一 个 可 传递 关系 。 所 有 的 可 达 对 象 都 可 以 认为 是 活跃 的 。 这 
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是 偏 保守 的 ， 有 可 能 包含 应 用 程序 未 来 永远 不 会 使 用 的 对 象 ， 但 是 它 不 会 比 RC 方法 保留 更 多 无 
用 对 象 ， 因为 所 有 可 达 对 象 都 一 定 有 非 零 引用 。RC 保留 了 所 有 可 达 对 象 ， 以 及 循环 引用 留 下 的 
漂浮 垃圾 。 
确定 对 象 可 达 性 的 过 程 称 为 “可 达 性 分 析 ”"。 根 据 定 义 ， 这 个 过 程 包含 两 个 阶段 : 第 一 阶段 
是 找到 直接 可 达 对 象 (“ 根 ”对 象 ); 第 二 阶段 是 找到 所 有 间接 可 达 对 象 。 
O 第 一 阶段 检查 应 用 程序 的 执行 上 下 文 ， 确 定 持 有 对 象 引用 的 〈 在 栈 、 寄 存 器 和 全 局 变量 
中 的 ) 所 有 槽 位 。 这 些 槽 位 合 称 为 “ 根 集 ”( root-set ) ， 这 个 过 程 被 称 为 “ 根 集 枚 举 ”。 
根 集 持 有 的 引用 称 为 “ 根 引用 ”， 或 者 简称 “ 根 ”。 
口 第 二 阶段 从 根 对 象 开始 ， 通 过 跟踪 可 达 对 象 中 的 引用 遍历 对 象 邻接 图 ， 直 到 所 有 的 可 达 
对 象 都 被 访问 过 。 这 个 过 程 通常 称 为 “ 堆 追 踪 ” 或 者 “对 象 追 踪 ”。 
所 有 的 可 达 对 象 都 被 标记 为 活跃 ， 其余 的 对 象 则 是 垃圾 。 所 以 第 二 阶段 也 称 为 “活跃 对 象 标 
记 ”。 使 用 可 达 性 分 析 的 GC 算法 称 为 “追踪 GC”。 
通常 不 能 在 应 用 程序 活路 运行 的 时 候 执行 对 象 追 踪 , 因为 执行 上 下 文 和 对 象 图 都 在 持续 变化 
之 中 。 应 用 程序 执行 和 可 达 性 分 析 之 间 是 一 个 竞 态 条 件 。 例 如 ， 如 果 在 栈 枚 举 之 后 以 及 寄存 器 枚 
举 之 前 ， 一 个 寄存 器 R 内 的 引用 S 被 安装 到 栈 上 ， 并 且 寄 存 器 R 被 清空 。 那 么 引用 R 就 从 根 集 
FERT» 
因此 ，GC 开始 可 达 性 分 析 ( 根 集 枚 举 和 堆 追 踪 ) 的 时 候 ， 应 用 程序 执行 通常 会 被 暂停 。 如 
果 这 个 应 用 程序 是 多 线程 的 ， 那 么 所 有 的 线程 都 要 暂停 。 这 称 为 “停止 世界 ”( stop-the-world )。 
GC 结束 之 后 才能 恢复 应 用 程序 运行 。GC 暂停 时 间 可 能 会 影响 到 应 用 程序 的 响应 性 。 有 些 算法 
会 减少 暂停 时 间 ， 甚 至 试图 完全 消除 它 。 我 们 将 在 第 四 部 分 讨论 这 个 主题 。 
下 面 给 出 对 象 追 踪 阶 段 的 伪 代 码 。 它 以 深度 优先 顺序 从 根 集 遍 历 对 象 邻接 图 。 
void traverse_object_graph() 


{ 
mark_stack = load_root_references()j; 


while ( !stack_is_empty(mark_stack) ) { 
Object* ovar = stack_pop( mark_stack ); 
for (each object oref referenced by object ovar) { 
if( obj_is_marked(oref) ) 
continue; 
mark_object( oref ); 
stack_push( mark_stack, oref); 


} 
} 


这 个 算法 首先 把 根 集 引 用 加 载 到 栈 上 (mark_stack )， 然 后 弹出 栈 顶 元 素 用 于 对 象 扫描 。 
未 标记 的 对 象 引用 被 压 和 人 栈 中 。 持 续 这 个 过 程 直 到 栈 空 ， 这 时 所 有 的 可 达 对 象 都 被 标记 了 。 
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54 RC 与 对 象 追踪 
很 有 趣 一 点 的 是 ，RC 和 对 象 追踪 的 特性 是 互补 的 。 
(1) RC 试图 找到 不 再 被 引用 的 ( 即 死亡 的 ) 对 象 。 对 象 追 踪 试 图 找到 可 达 ( 即 活跃 的 ) 对 象 。 
(2) RC 在 运行 时 执行 ， 是 应 用 程序 执行 的 一 部 分 。 对 象 追 踪 需 要 暂停 应 用 程序 的 执行 。RC 
有 运行 时 开销 ， 而 对 象 追踪 需要 暂停 时 间 。 
(3) 一 旦 应 用 程序 失去 对 一 个 对 象 的 引用 , RC 会 实时 识别 出 死亡 对 象 。 对 象 一 个 接 一 个 地 死 
亡 。 对 象 追 踪 则 以 批 处 理 模 式 识别 死亡 对 象 。 当 所 有 的 可 达 对 象 都 标记 好 时 ， 剩 余 对 象 
都 一 起 瞬间 死亡 。 在 对 象 追 踪 结 束 前 ， 可 以 认为 所 有 的 对 象 都 活着 。 
(4) RC 可 以 实时 回收 死亡 对 象 并 重用 内 存 。 堆 上 只 包含 活路 对象。 对象 追踪 只 在 一 次 回收 后 
腾 出 并 利用 空间 。 当 它 开 始 回收 的 时 候 ， 堆 可 能 主要 被 死亡 对 象 所 占据 。 换 句 话 说， 使 
用 对 象 追踪 的 内 存 利用 效率 要 低 一 些 。 
可 以 在 同一 个 GC 算法 中 实现 RC 和 对 象 追踪 ， 以 利用 二 者 的 优点 。 混 合算 法 可 以 用 RC 动 
态 处 理 某 些 对 象 ， 把 另 一 些 对 象 留 给 对 象 追踪 。 
直观 来 看 ， 我 们 可 以 在 引用 不 会 大 量 更 新 的 区 域 应 用 RC。 如 果 我 们 把 堆 分 为 几 个 区 域 ， 可 
能 某 个 区 域 的 对 象 比 男 一 个 区 域 的 对 象 引用 更 新 更 频繁 ,引用 更 新 最 频繁 的 区 域 是 应 用 程序 的 执 
‘TEER. 
图 5-1 中 展示 了 这 些 区 域 ， 其 中 区 域 1 是 执行 上 下 文 。 区 域 间 的 箭头 表示 从 一 个 区 域 到 另 一 
个 区 域 中 对 象 的 引用 。 





图 5-1 应 用 程序 中 有 引用 的 区 域 


延迟 引用 计数 ( deferred reference-counting, DRC ) 是 一 种 使 用 RC 和 对 象 追 踪 的 混合 算法 。 
DRC Haber dE ( 即 图 5-1 中 的 区 域 2 和 区 域 3 ) 的 引用 更 新 ， 这 可 以 节省 追踪 执行 上 下 文中 引 
用 更 新 的 大 量 运 行 时 开销 。 当 一 个 对 象 RC 降 为 零 时 ， 就 把 它 放 入 一 个 名 为 ZCT ( 零 引 用 表 ) 的 
表 中 。 当 堆 满 了 或 者 ZCT 满 了 的 时 候 ， 就 会 触发 一 次 对 象 追踪 过 程 ， 这 个 过 程 只 识别 根 ( 即 区 
域 1 中 的 引用 ), ZCT 中 由 根 引 用 的 对 象 被 认为 是 活跃 的 ,其 余 对 象 被 认为 已 经 死亡 , 会 被 回收 。 

男 外 一 种 情况 下 ， 如果 已 知 区 域 3 中 的 对 象 多 数 是 活跃 的 , 在 回收 过 程 中 就 不 需要 花 时 间 追 
踪 其 中 的 对 象 ， 那么 可 以 假设 区 域 3 为 全 活 ， 这 样 就 可 以 节省 对 象 追踪 时 间 并 减少 GC 暂停 时 间 。 
因为 区 域 2 中 的 一 些 活路 对象 可 能 是 通过 区 域 3 中 的 对 象 可 达 的 ， 所 以 GC 需要 找到 从 区 域 3 到 
区 域 2 的 那些 引用 。 
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具体 思路 是 在 运行 时 动态 追踪 这 些 引 用 。 一 旦 安装 一 个 从 区 域 3 指向 区 域 2 的 引用 时 ， 就 在 
记忆 集 (remembered set， 或 者 简单 说 remember set ) 中 记录 覃 位 地 址 。 一 旦 堆 空 间 满 了 或 者 记忆 
集 满 了 ,就 用 一 次 追踪 GC 回收 区 域 2 ( 既然 认为 区 域 3 都 是 活跃 的 ), 现在 对 象 妃 踪 的 初始 引用 
包含 来 自 根 集 ( 区域 1 ) 和 来 自 记忆 和 集 (区域 3 ) 中 的 引用 。 对象 妃 踪 只 在 区 域 2 上 执行 。“ 区 域 
式 GC” 和 “分 代 式 GC” 算 法 中 应 用 了 这 个 思路 。 

也 可 以 只 在 某 些 类 型 的 对 象 上 应 用 RC, 这样 可 以 实时 回收 它们 的 空间 。 当 堆 满 了 的 时 候 ， 
就 触发 一 次 普通 对 象 追 踪 回 收 。 如 果 引 用 计数 的 对 象 是 生 灭 频繁 的 主要 活跃 对 象 , 那么 这 种 方法 
很 有 用 。 对 它们 使 用 RC 可 以 实时 回收 内 存 , 以 此 推迟 下 一 次 对 象 妃 踪 回 收 。 这 个 思路 被 称 为 “ 循 
环 GC” ( Cycler GC ). 


5.5 GC 安全 所 


在 GC 社区 中 ， 人 们 通常 把 应 用 程序 线程 称 为 修改 天 (mutator )， 因 为 它们 会 修改 堆 。 执 行 
垃圾 回收 的 线程 则 称 为 回收 天 (collector )， 因 为 它们 回收 推 。 注意 修改 融和 回收 带 不 一 定 是 分 离 
的 线程 ， 一 个 线程 可 以 在 修改 顺和 回收 器 之 间 变 换 角 色 。 

前 面 已 经 提 到 过 ， 对 象 追 踪 需 要 和 暂停 修改 融 来 进行 垃圾 回收 。 为 了 枚 举 根 集 ， 回 收 融 需要 了 
解 引 用 在 执行 上 下 文中 安装 的 位 置 。 这 个 信息 由 运行 时 和 编译 需 提 供 。 例 如 ， 只 有 编译 器 了 解 ， 
在 代码 的 某 个 执行 点 上 , 哪些 栈 槽 位 和 寄存 器 中 持 有 引用 。 前 提 是 编译 器 在 编译 程序 的 时 候 记 录 
了 这 个 信息 。 如 果 编 译 器 没有 维护 这 类 信息 ,回收 器 只 能 利用 某 些 启发 式 算法 来 保守 地 猜测 上 下 
文中 的 引用 。 例 如 ,一 个 栈 槽 位 中 的 值 看 起 来 像 一 个 指针 ， 它 可 以 被 看 作 一 个 引用 ， 然 后 回收 需 
通过 检查 它 指向 堆 的 位 置 是 否 真是 一 个 对 象 来 验证 猜测 。 如 果 它 是 一 个 对 象 , 回收 需 就 认为 它 是 
活路 的 ， 尽 管 这 不 一 定 是 真 的 ， 因 为 栈 上 的 值 可 能 就 是 一 个 无 关 的 数字 ， 比 如 一 个 整数 。 这 类 
GC 算法 保留 了 一 个 活跃 对 象 的 超 集 ， 因 此 称 为 保守 式 GC。 如 果 回 收费 能 够 得 到 精确 的 根 集 ， 
那么 称 为 精确 式 GC. 

为 了 支持 精确 根 集 枚 举 , 编译 带 可 以 为 每 条 指令 记录 相关 信息 ,以 备 在 这 条 指令 上 需要 暂停 
运行 ( 即 停止 世界 ) 时 使 用 。 但 是 为 每 条 指令 维护 这 些 信息 ， 代 价 很 昂贵 ， 也 没有 必要 ， 因 为 指 
令 中 只 有 很 小 一 部 分 有 机 会 成 为 实际 执行 中 的 暂停 点 。 编 译 常 只 需要 为 这 些 点 维护 相关 信息 , 这 
些 点 称 为 GC 安全 点 ， 在 这 些 点 上 执行 根 集 枚 举 和 垃圾 回收 是 安全 的 。 

并 非 在 所 有 语言 中 ， 编 译 澡 都 普遍 有 能 力 支 持 精确 根 集 枚 举 。 只 有 安全 语言 具备 这 种 能 力 ， 
因为 非 安全 语言 可 能 会 让 编译 天 迷惑 ， 比 如 在 整数 变量 中 保存 引用 。 

暂停 修改 融 基 本 上 有 两 种 方法 : 抢占 式 与 自愿 式 。 抢 占 式 方法 是 指 ， 只 要 回收 需 需 要 执行 回 
收 的 时 候 就 可 以 暂停 修改 顺 。 如 果 它 发 现 修改 天 暂停 在 非 安 全 点 上 , 它 可 以 恢复 修改 带 ， 向 前 深 
动 到 一 个 安全 点 。 目 前 几乎 没有 VM 采用 这 种 方法 。 


自愿 式 和 暂停 是 指 ， 如 果 回 收 需 想 要 触发 一 次 回收 , 它 会 设置 一 个 标志 ,或 者 向 修改 需 发 出 一 
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个 通知 。 修改 器 一 旦 发 现 这 个 标志 , 或 者 收 到 通知 ,就 会 在 某 个 安全 点 暂停 自己 的 工作 。 修改 此 
可 以 在 GC 安全 点 轮 询 这 个 标志 ， 那 么 轮 询 点 就 是 安全 点 。 编 译 带 负责 在 安全 点 插入 轮 询 指 令 。 
VM 代码 有 时 候 也 需要 一 些 安 全 点 ， 这 是 由 VM 开发 者 搬入 的 。 
抢占 式 方法 和 自愿 式 方法 有 时 候 也 被 分 别称 为 基于 中 断 的 方法 和 基于 轮 询 的 方法 。 目前 常用 
的 是 基于 轮 询 的 方法 。 轮 询 点 插入 要 遵循 下 列 基本 原则 。 
(1) 首先 , 程序 代码 中 的 轮 询 点 应 该 足够 接近 , 这 样 回收 费 等 待 修改 问 暂 停 不 需要 人 花 太 长 时 间 。 
回收 器 设置 回收 标志 的 时 候 ， 堆 可 能 已 经 满 了 ， 所 以 其 他 一 些 修改 器 可 能 已 经 在 焦急 地 等 
待 回收 顷 来 回收 堆 ， 接 下 来 才能 继续 运行 。 修 改 器 不 应 该 运行 太 长 时 间 而 不 轮 询 标志 。 
(2) 其 次 ， 程 序 代 码 中 的 轮 询 点 应 该 尽 可 能 少 。 每 次 轮 询 点 执行 都 会 带 来 一 些 开 销 。 太 多 的 
轮 询 点 会 导致 很 高 的 运行 时 负担 。 


这 两 个 原则 是 相互 矛盾 的 。 最 好 的 妥协 是 只 拥有 必要 且 足 够 的 安全 点 。 以 下 是 一 些 需要 考虑 
的 因素 。 


O 对 象 分 配点 必须 是 安全 点 。 如 果 栈 已 经 满 了 ， 分 配 可 能 失败 ， 那 么 就 应 该 触发 一 次 回 
收 ， 为 这 次 分 配 回收 内 存 。 
口 轮 询 点 应 该 插入 到 可 能 长 时 间 执行 的 点 。 通 常 来 说 ， 如 果 一 个 应 用 程序 运行 很 长 时 间 , 
那么 它 必 然 有 重复 代码 序列 一 一 要 么 是 循环 ， 要 么 是 通过 递归 调用 。 因 此 ， 在 循环 返回 
处 和 方法 调用 处 拥有 轮 询 点 是 至 关 重 要 的 。 
口 最 后 一 个 应 该 拥有 安全 点 的 位 置 是 阻塞 处 或 休眠 处 ， 这 些 位 置 上 线程 无 法 继续 进行 。 阻 
塞 〈 或 休眠 ) 线程 不 能 响应 回收 触发 事件 ， 但 是 它 应 该 在 进入 休眠 或 者 阻塞 之 前 准备 好 
状态 ， 以 允许 回收 发 生 。 
除了 执行 时 间 控 制 这 一 方面 , 从 另 一 个 角度 看 安全 点 位 置 选取 也 是 有 帮助 的 。 我们 可 以 根据 
栈 状 态 来 考虑 选择 策略 。 
当 修 改 絮 因为 GC 而 暂停 时 ， 修 改天 的 栈 由 被 调用 的 方法 的 栈 帧 组 成 ， 如 果 这 是 一 个 Java 
应 用 程序 的 主线 程 ， 那 么 底 帧 为 main () 。 除 了 顶层 帧 之 外 ， 每 个 栈 帧 都 在 一 个 调用 点 上 。 最 项 
栈 帧 或 者 是 一 个 触发 GC 的 对 象 分 配点 ,或 者 是 在 长 时 间 运 行 (循环 )， 又 或 者 是 在 阻塞 (于 一 
个 系统 调用 ) 的 状态 中 。 所 有 这 些 位 置 都 应 该 是 准备 好 了 栈 信息 用 于 根 枚 举 的 安全 点 。 
在 实际 的 实现 中 ,安全 区 域 用 来 支持 阻塞 ( 和 休眠 ) 的 情况 。 当 GC 标志 被 置 起 的 时 候 ， 如 
果 线 程 已 经 处 于 阻塞 状态 ,这 个 线程 无 法 轮 询 标 志 , 就 需要 安全 区 域 来 允许 回收 继续 进行 。 安 全 
区 域 是 指 这 样 一 段 代码 , 线程 进入 这 个 区 域 时 , 枚 举 上 下 文 已 经 准备 好 , 并 且 在 这 个 区 域内 没有 
引用 被 修改 。 换 句 话 说 ,在 这 个 区 域内 的 任何 位 置 上 , 根 枚 举 和 对 象 追踪 都 是 安全 的 。 安 全 区 可 
以 看 作 扩展 的 大 型 安全 点 。 


当 修 改 器 从 阻塞 中 恢复 时 , 在 离开 安全 区 域 之 前 ， 它 会 检查 是 否 有 回收 正在 进行 中 。 如 果 答 
案 是 肯定 的 ， 那 么 修改 器 就 像 在 安全 点 上 一 样 ， 通 过 暂停 自身 留 在 安全 区 域内 ， 直 到 回收 结束 。 
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如 果 没 有 回收 正在 进行 中 ,那么 当 修 改 吾 从 阻塞 中 恢复 之 后 ， 它 可 以 继续 运行 ， 离 开 这 个 区 域 。 
下 面 是 回收 器 暂停 所 有 修改 器 来 进行 根 枚 举 的 伪 代码 。 


stop_the_world_root_set_enumeration () 
{ 

vm_suspend_all_threads(); 

for ( each thread tvar ) { 

vm_enumerate_roots_in_thread( tvar ); 

} 

vm_enumerate_root_in_globals(); // 在 全 局 数据 中 
} 


下 面 的 伪 代 码 是 轮 询 点 的 一 个 典型 实现 。 


void gc_polling_point () 
{ 
VM_Thread* self = current_thread(); 
if( !self->suspend_event ) 
return; 


self->at_safe_point = true; 
wait_for_resume( self->resume_event ); 
self->at_safe_point = false; 

} 


下 面 的 伪 代 码 是 安全 区 域 和 口 和 出 口 的 一 个 典型 实现 。 


void gc_safe_region_enter () 

{ 
VM_Thread* self = current_thread(); 
self->at_safe_point = true; 

} 


void gc_safe_region_exit () 
{ 
VM_Thread* self = current_thread(); 
if( !self->suspend_event ) { 
self->at_safe_point = false; 
return; 


} 
wait_for_resume( tself->resume_event ); 


self->at_safe_point = false; 
} 


回收 器 和 修改 器 之 间 线 程 交 互 的 实际 控制 可 能 要 复杂 得 多 , 但 概念 是 不 变 的 。 第 6 章 将 深入 
讨论 这 个 主题 。 


5.6 ”常用 追踪 GC 算法 
对 象 追 踪 标 记 了 堆 中 所 有 活跃 对 象 之 后 ， 回 收费 就 会 回收 所 有 死亡 对 象 。 
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根据 回收 死亡 对 象 方式 的 不 同 , 基本 上 | 回收 算法 。 一 种 是 在 对 象 标记 阶段 之 后 清除 死 
亡 对 象 ， 称 为 标记 清除 GC ( mark-sweep GC )。 男 一 种 是 把 所 有 活跃 对 象 移动 到 一 个 新 空间 中 ， 
然后 释放 其 余 空间 ， 称 为 追踪 复制 GC ( trace-copy GC ). 


5.6.1 标记 清除 
图 5-2 展示 了 标记 清除 回收 的 过 程 ，。 


GC 之 前 








TT 


Bux 国 活跃 对 象 。” [_ | 空闲 空间 
图 5-2 标记 清除 GC 不 同 阶 段 的 堆 状 态 
在 标记 清除 GC 中 ， 至 少 需 要 在 堆 上 遍历 两 趋 , 一 赵 用 于 标记 , 一 赵 用 于 清除 。 当 堆 满 了 
的 时 候 ， 触 发 一 次 回收 。 在 回收 之 后 ， 把 释放 的 空间 标记 出 来 ， 用 于 新 对 象 分 配 。 标 记 清 除 
GC 的 伪 代 码 如 下 。 


void mark_sweep () 


{ 





passl: 
traverse_object_graph() ; 
pass2: 
sweep_space(); 


5.6.2 ”追踪 复制 


追踪 复制 GC 把 这 两 趟 合并 为 一 赵 。 基 本 上 它 有 两 个 空间 ， 一 个 用 于 分 配 ， 另 一 个 为 复制 对 
象 而 保留 。 每 当 它 标记 一 个 活跃 对 象 之 后 ， 就 把 这 个 对 象 移动 到 保留 空间 ， 然后 通过 遍历 这 个 对 
象 的 邻接 图 继续 处 理 其 他 对 象 。 图 5-3 展示 了 追踪 复制 回收 过 程 。 
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图 5-3 追踪 复制 GC 不同 阶段 的 堆 状 态 


回收 结束 之 后 ,分配 空间 和 保留 空间 的 角色 互 换 。 然 后 修改 器 在 分 配 空 间 上 分 配 新 对 象 ， 一 
旦 它 被 填 满 ， 就 会 触发 新 一 轮回 收 。 

显然 ,追踪 复制 GC 有 如 下 优点 : 只 有 一 趟 操作 ; 相 邻 活路 对象 带 来 更 好 的 数据 局 部 性 ; 连 
续 空 闲 空间 有 助 于 更 快 的 对 象 分 配 。 它 的 缺点 是 必须 保留 足够 的 空 pie tioi 保守 的 设计 
会 保留 一 半 堆 ,万 一 大 多 数 对 象 都 是 活跃 的 , 也 足以 应 对 。 因 此 , 这 个 算法 变 体 称 为 半空 间 GC。 
与 之 相 比 ， 标 记 清 除 GC 是 “就 地 回收 ” fae eee ee 


在 追踪 复制 GC 中 ， 当 一 个 对 象 复制 到 保留 空间 后 ， 原 来 的 副本 仍 保留 在 分 配 空间 中 ， 因 为 
可 能 有 其 他 一 些 对 象 仍 然 在 引用 它 。 在 原来 的 对 象 中 安装 一 个 指向 新 副本 的 指针 《〈 称 为 转发 指 
针 )， 这 样 其 他 对 象 可 以 从 原始 副本 中 找到 新 地 址 。 持 有 原来 副本 引用 的 对 象 应 该 更 新 它们 的 指 
针 以 指向 新 的 副本 。 追 踪 复制 GC 的 伪 代 码 如 下 。 


void trace_copy () 
{ 
stack mark_stack = load_root_set(); 


while ( !stack_is_empty(mark_stack) ) { 
Object** slot = stack_pop( mark_stack )j; 
Object* ovar = *slot; 


Object* new_ovar = null; 
if( obj_is_copied(ovar) ){ 
// ovar 已 经 被 复制 
new_ovar = forwarding_pointer (ovar); 


// 更 新 楼 位 以 指向 新 地 址 
*slot = new_ovar; 
continue; 
} 
mark_object( ovar ); 
// 复制 ovar， 在 ovar 中 安装 转发 指针 
new_ovar = copy_object( ovar ); 
// 8 Be RAZ VIAS eB HOLE 
*slot = new_ovar; 
for (each reference slot pref in new_ovar) { 
stack_push( mark_stack, pref ); 
} 
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注意 这 个 算法 与 traverse_object_graph() 中 的 算法 有 一 个 不 明显 的 区 别 ， 那 就 是 ， 标 
记 栈 (mark_stack ) 的 元 素 类 型 不 是 对 象 引 用 ( 用 类 型 object* 表 示 )， 而 是 持 有 对 象 引 用 的 
槽 位 地 址 ， 即 引用 槽 位 ( 用 类 型 object** 表 示 )。 这 个 变化 至 关 重 要 ， 因 为 如 果 被 引用 对 象 发 
生 移 动 ， 那 么 槽 中 的 值 也 需要 更 新 。 因 此 ， 第 一 条 语句 是 1oad_root_set () ,而 不 是 之 前 使 用 


的 load_root_references()。 


5.7 常用 追踪 GC 变 体 
没有 哪个 GC 算法 能 在 所 有 应 用 程序 中 都 发 挥 最 优 性 能 。 因 此, 要 根据 目标 应 用 程序 的 特性 决 
定 使 用 哪个 算法 。 本 节 会 介绍 几 种 通过 修改 标记 清除 算法 和 追踪 复制 算法 来 实现 的 追踪 GC 变 体 。 


5.7.1 标记 压缩 


使 用 标记 清除 GC， 我 们 可 以 把 清除 修改 为 压缩 ， 这 样 可 以 留 下 连续 空闲 空间 。 其 思路 是 把 
所 有 的 活跃 对 象 移动 到 堆 的 一 端 ， 如 图 5-4 所 示 。 该 算法 称 为 标记 压缩 GC ( mark-compact GC )。 


GC 之 前 
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图 5-4 ”标记 压缩 GC 不同 阶段 的 堆 状 态 


尽管 标记 压缩 GC 具有 获得 连续 空闲 空间 的 优点 ， 但 与 标记 清除 GC 相 比 ， 代 价 是 额外 的 对 
象 移动 。 因 此 ， 标 记 压 缩 通常 不 作为 GC 实现 中 的 独立 算法 ， 而 是 与 其 他 回收 算法 结合 使 用 。 





5.7.2 ”滑动 压缩 


可 以 通过 某 种 方式 来 设计 标记 压缩 算法 , 使 得 压缩 前 后 活跃 对 象 在 堆 中 的 顺序 保持 不 变 。 也 
就 是 说 , 要 按照 它们 原来 堆 地 址 的 线性 顺序 移动 对 象 。 这 种 变 体 称 为 滑动 压缩 GC ( slide-compact 
GC ), 通常 这 种 方法 的 缓存 局 部 性 比 妃 踪 复 制 更 好 一 些 。 追 踪 复 制 按 照 在 对 象 图 遍历 过 程 中 活跃 
对 象 的 访问 顺序 来 移动 对 象 , 这 个 顺序 通常 不 同 于 原来 的 堆 地 址 顺序 。 原 来 的 堆 地 址 顺序 通常 是 
对 象 分 配 的 顺序 ， 也 是 对 象 访问 的 顺序 。 维 护 这 个 顺序 意味 着 良好 的 访问 局 部 性 。 
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典型 的 滑动 压缩 GC 需要 在 回收 过 程 中 增加 额外 两 趋 操作 ,一 趟 计算 所 有 生存 对 象 的 新 位 置 ; 
男 一 趟 更 新 活跃 对 象 中 的 所 有 3 引用， 以 指向 它们 所 引用 对 象 的 新 地 址 。 额 外 添加 趟 次 是 因为 ， 和 
就 地 式 GC 一 样 ， 对 象 移动 的 顺序 对 于 正确 性 是 至 关 重 要 的 。 和 否则 ， 移 动 一 个 活跃 对 象 可 能 会 导 
致 男 外 一 个 活跃 对 象 在 移动 之 前 就 被 覆盖 掉 。 下 面 给 出 滑动 压缩 GC 的 伪 代 码 。 
void slide_compact () 
{ 
passl: 
traverse_object_graph(); 
pass2: 
compute_new_locations(); 
pass3: 
fix_object_references(); 
pass4: 
compact_space() ; 





注意 额外 的 这 几 趟 ， 它 们 的 顺序 对 于 滑动 压缩 GC 不 是 强制 性 的 。 第 15 章 将 讨论 对 它 进 行 
的 各 种 优化 。 


5.7.3 ”追踪 转发 

追踪 复制 GC 的 一 个 变 体 不 需要 每 次 切换 分 配 空间 和 保留 空间 的 角色 。 而 是 , 它 总 是 使 用 一 
个 空间 用 作 分 配 ， 另 一 个 空间 用 作 复 制 。 我 们 称 之 为 追踪 转发 GC ( trace-forward GC )。 这 是 基 
于 这 样 一 个 观察 ,有 些 应 用 程序 在 堆 满 的 时 候 只 有 少量 活跃 对 象 , 它 不 需要 保留 一 半 堆 用 于 复制 ， 
如 图 5-5 所 示 。 


GC 之 前 
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转发 之 后 的 第 1 轮 GC 








Bee Emre “|_] 空闲 空间 旧 对 象 
图 5-5 追踪 转发 GC 不 同 阶段 的 堆 状 态 
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在 每 次 回收 过 程 中 , 活跃 对 象 都 被 转发 到 保留 空间 。 在 之 前 回收 中 已 经 被 转发 的 旧 对 象 不 参 
与 当前 这 一 轮回 收 的 转发 。 在 几 轮 回收 之 后 ,保留 空间 不 足以 持 有 转发 对 象 。 回 收 必须 回 到 像 标 
记 压 缩 这 样 的 就 地 式 GC 算法 。 


5.7.4 标记 复制 


有 一 种 追踪 转发 和 标记 压缩 的 混合 算法 ， 称 为 标记 复制 ( mark-copy )。 它 标记 所 有 的 活跃 对 
象 ， 但 不 在 标记 过 程 中 转发 。 标 记 复 制 算 法 用 额外 一 趟 操作 把 标记 过 的 对 象 ( 活跃 对 象 ) 复制 到 
保留 空间 ， 所 以 它 不 是 就 地 式 GC 算法 。 与 标记 压缩 相 比 ， 标 记 复 制 的 优点 是 ， 因 为 被 引用 的 对 
象 不 会 被 对 象 移动 所 覆盖 , 所 以 它 可 以 把 引用 修正 和 对 象 移动 过 程 合并 到 一 起 。 可 以 通过 原来 对 
象 中 的 转发 指针 找到 被 转发 对 象 的 新 地 址 。 


void mark_copy () 
{ 
passl: 
traverse_object_graph() ; 
pass2: 
compute_new_locations(); 
pass3: 
compact_space(); 
} 


在 极端 情况 下 ,标记 复制 GC 中 的 保留 空闲 空间 可 能 小 到 只 有 一 页 (或 者 根据 设计 的 任意 大 
小 ) 我 们 称 之 为 “种 子 页 ”。 可 以 把 一 个 或 多 个 页 中 的 活路 对 象 撤 移 到 种 子 页 中 ,然后 这 些 撤 空 
的 页 面 被 释放 ,可 以 被 当 作 新 的 保留 空 首页 。 这 个 设计 保留 了 压缩 和 复制 回收 的 优点 ， 同 时 又 只 
需要 保留 很 小 的 空闲 空间 用 于 复制 。 在 并 发 回收 中 , 扒 是 一 部 分 接着 一 部 分 回收 的 ， 这 个 特性 就 
非常 有 用 。 第 17 章 将 讨论 并 发 移动 回收 。 
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在 追踪 转发 GC 中 ， 旧 对 象 尽 管 不 需要 参与 对 象 转发 ， 但 仍 需要 参与 对 象 标记 ， 和 否则 GC 无 
法 正确 找到 分 配 空间 中 的 所 有 活跃 对 象 。 旧 对 象 通过 两 种 方式 参与 对 象 标记 。 一 种 与 分 配 空间 中 
的 对 象 一 样 ， 除 了 可 达 的 旧 对 象 ( 也 就 是 活跃 对 象 ) 不 被 转发 ， 就 和 区 域 式 GC 一 样 。 另 一 种 完 
全 不 追踪 旧 对 象 ， 而 是 像 在 分 代 式 GC 中 一 样 使 用 记忆 集 。 

分 代 式 GC 的 设计 是 基于 这 样 的 观察 : 从 上 一 次 回收 中 活 下 来 的 对 象 通常 会 活 得 更 久 。GC 
在 下 一 次 回收 中 不 会 花费 时 间 再 次 追踪 它们 , 而 是 假定 它们 都 是 活跃 的 。 它 需要 在 记忆 集中 记录 
所 有 从 老 对 象 到 新 对 象 的 引用 ， 把 它们 作为 根 引 用 的 一 部 分 。 

如 图 5-6 所 示 ， 现 在 分 配 空间 是 第 1 代 (或 者 被 称 为 年 轻 一 代 、 托 儿 所 ， 等 等 )， 转 发 空间 
是 第 2 代 (或 者 老 一 代 、 成 熟 一 代 ， 等 等 )。 既 然 GC 不 在 第 2 代 中 追踪 ， 那 么 所 有 到 第 2 代 的 
引用 都 被 忽略 ， 图 中 用 虚线 箭头 表示 。 第 2 代 的 对 象 完全 不 会 被 回收 。GC 只 需要 关心 到 第 1 代 
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图 5-6， 推 中 的 几 代 以 及 各 代 之 间 的 引用 
1. 记忆 集 与 写 屏障 


在 堆 布局 如 图 5-6 所 示 的 分 代 式 回收 中 ， 到 第 1 代 的 引用 保存 在 两 个 集合 之 中 ， 一 个 是 来 自 
执行 上 下 文 的 根 集 ，, 男 一 个 是 来 自 第 2 代 的 记忆 集 。 根 集 是 通过 执行 上 下 文中 的 枚 举 获得 的 。 根 
据 算法 的 不 同 ， 记 忆 集 来 自 最 后 一 次 回收 ,或 来 自 写 屏 障 。 我 们 把 记忆 集中 来 自 回 收 的 部 分 称 
为 “回收 顷 记 忆 集 ”"， 把 来 自 写 屏障 的 部 分 称 为 “修改 融 记 忆 集 ”"。 图 5-7 展示 了 到 第 1 代 的 所 有 
引用 。 








图 5-7 根 集 与 记忆 集 


回收 费 记 忆 集 持 有 上 一 次 回收 过 程 中 记录 的 引用 。 有 些 GC 算法 不 把 所 有 来 自 第 1 代 的 活跃 
对 象 转发 到 第 2 代 , 而 是 把 一 部 分 活跃 对 象 保存 在 第 1 代 中 。 当 其 他 对 象 被 转发 到 第 2 代 的 时 候 ， 
从 转发 对 象 (第 2 代 ) 到 非 转 发 对 象 (第 1 代 ) 的 引用 就 变 成 了 跨 代 引用 , 应 该 由 回收 需 来 记忆 。 

修改 器 记忆 集 持 有 上 一 次 回收 之 后 应 用 程序 执行 过 程 中 记录 的 引用 。 应 用 程序 可 能 会 在 执行 
过 程 中 写 入 一些 从 第 2 代 到 第 1 代 的 跨 代 引用 。 这 些 引用 可 以 通过 写 屏 隐 捕 获 ， 写 屏障 是 一 个 每 
当 引 用 写 入 堆 时 就 会 调用 的 回调 函数 。 写 屏障 查看 写 入 的 引用 是 否 从 第 2 代 到 第 1 代 ， 如 果 答 案 
为 肯定 的 话 就 记录 它 。 以 下 代码 是 一 个 写 屏 障 的 实现 示例 。 每 当 向 slot 写 人 引用 ovar 时 就 会 
调用 它 。 


void write_barrier(Object** slot, Object* ovar) 
{ 
if ( slot is in old-generation) { 
if ( ovar is in young-generation) 
mutator_remember( slot ); 
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与 RC 播 桩 类 似 ， 写 屏障 由 编译 器 在 每 次 引用 写 人 堆 的 时 候 插入 。JNI 代码 也 要 遵循 这 个 
惯例 。 

当 应 用 程序 执行 对 象 克隆 或 者 数组 复制 的 操作 时 ,不 需要 为 每 个 引用 写 人 使 用 写 屏障 。 可 以 
只 调用 一 个 写 屏障 ， 记 录 对 这 个 对 象 的 所 有 引用 写 入 。 

可 以 利用 底层 操作 系统 的 虚拟 内 存 支 持 来 隐 式 实现 写 屏障 , 而 不 用 插 柱 每 个 引用 写 操作 。 也 
就 是 说 ，GC 保护 第 2 代 的 内 存 页 ， 这 样 每 个 对 其 执行 的 写 操作 都 会 导致 页 面 异常 。 异 常 处 理 函 
数 作为 写 屏障 ， 会 执行 记忆 操作 。 

注意 ， 写 屏障 通常 记录 槽 地 址 (slot ) 而 不 是 引用 本 身 ( ovar )， 原 因 是 这 个 模 位 可 能 在 下 
一 次 回收 之 前 很 快 被 再 次 写 入 ,那么 引用 值 就 会 被 替换 为 新 值 。 旧 值 ovar 引用 的 对 象 可 能 在 回 
收 的 时 候 就 已 经 死亡 了 ， 因 此 不 需要 记忆 它 。 这 里 的 写 屏障 值 只 是 为 了 告诉 GC， 记 录 的 槽 可 能 
持 有 一 个 跨 代 引用 。GC 负责 在 回收 的 过 程 中 检查 槽 中 实际 的 值 。 

2. 牌 桌 与 记忆 集 枚 举 

记忆 集 可 以 有 效 减少 第 2 代 中 的 追踪 时 间 。 一 个 问题 是 如 何 保存 记忆 集 。 简单 的 解决 方案 就 
是 在 VM 中 分 配 运行 时 数据 结构 , 但 如 果 存在 大 量 跨 代 引用 写 操作 的 话 , 这 可 能 会 导致 巨大 的 内 

一 个 替代 解决 方案 是 不 为 每 个 引用 写 保存 槽 地 址 , 而 是 在 堆 中 标记 这 个 模 位 来 表示 这 个 模 位 
可 能 包含 跨 代 引用 。 更 进一步 来 说 ,GC 可 以 标记 槽 位 所 在 的 堆 区 域 ( 比如 一 个 页 )， 而 不 是 分 别 
标记 每 个 槽 位 。 当 回收 发 生 的 时 候 ，GC 将 枚 举 这 些 标记 的 区 域 ， 找 到 持 有 跨 代 引 用 的 槽 位 。 这 
就 是 记忆 集 枚 举 ， 和 GC 在 根 集 枚 举 中 所 做 的 类 似 。 

记忆 集 枚 举 的 实现 依赖 于 堆 数据 结构 的 设计 。 例 如 ， 在 某 些 设计 中 ， 堆 以 页 为 粒度 来 组 织 ， 
每 个 页 都 有 一 个 页 头 来 存储 本 页 的 元 数据 。 在 应 用 程序 执行 过 程 中 , 当 老 一 代 中 发 生 引用 写 操作 
的 时 候 , 写 屏障 可 以 在 被 写 的 对 象 所 在 页 的 头 中 标记 一 位 。 这 一 位 表示 这 一 页 有 一 个 构 位 可 能 包 
含 跨 代 引 用 。 回 收发 生 的 时 候 ，GC 会 扫描 这 一 页 ， 逐 个 检查 对 象 ， 找 到 跨 代 引 用 。 这 种 计数 广 
法 称 为 “ 牌 桌 ” 或 者 “ 牌 标记 "。 本 例 中 的 页 就 是 一 张 牌 。 这 是 记忆 集 的 一 个 具体 实现 ， 因 此 也 
是 RC 的 一 种 具体 形式 。 

与 记忆 集 相 比 ; 牌 桌 辆 牲 枚 举 时 间 来 换取 较 小 的 内 存 负担 。 因 为 牌 桌 方法 只 需要 了 解 一 个 堆 
区 域 是 否 被 写 和 人， 所 以 可 以 重用 操作 系统 (OS) 支持 ， 就 是 把 被 写 的 页 在 它 的 页 表 项 中 标记 为 
脏 的 。 这 种 方式 不 需要 在 VM 中 实现 写 屏障 , 取而代之 的 是 读 取 页 表 的 胜 位 用 于 记忆 集 枚 举 。 由 
于 修改 器 记忆 集 应 该 在 回收 之 后 被 清空 ， 页 表 的 脏 位 在 回收 中 也 应 该 被 重 置 。 

再 次 强调 ,没有 哪个 算法 能 一 直 优 于 其 他 算法 。 我 们 要 根据 应 用 程序 特性 与 GC 算法 的 匹配 
度 来 选择 适合 的 算法 。 
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5.8 移动 式 GC 与 非 移动 式 GC 


标记 清除 GC 不 移动 对 象 ， 因 此 是 非 移 动 式 GC。 复制 或 者 压缩 GC 是 移动 式 GC。 本 节 会 讨 
论 它 们 的 一 些 优 缺点 。 


5.8.1 数据 局 部 性 
使 用 非 移 动 式 GC 的 时 候 ， 活 跃 对 象 与 死亡 对 象 以 及 空闲 空间 交替 并 存 。 对 活跃 对 象 的 访问 
是 分 散 于 内 存 中 的 ， 这 会 导致 较 差 的 数据 局 部 性 。 


移动 式 GC 可 以 一 起 移动 活跃 对 象 , 这 解决 了 分 散 访问 的 问题 。 但 它 需要 把 对 象 从 旧 位 置 复 
制 到 新 位 置 ， 因 此 还 要 把 所 有 过 时 引用 修正 为 指向 新 位 置 ， 而 这 样 做 会 带 来 开销 。 


5.8.2” 跳 增 指针 分 配 
移 走 活跃 对 象 之 后 ， 移 动 式 GC 留 下 了 连续 空闲 空间 ， 这 使 得 对 象 分 配 非常 简单 高 效 。 


移动 式 GC 可 以 使 用 一 个 指向 空闲 空间 中 当前 空闲 位 置 的 分 配 指针 。 当 分 配 一 个 对 象 的 时 候 ， 
移动 式 GC 只 会 把 分 配 指针 跳 增 对 象 大 小 。 这 称 为 “ 跳 增 指针 分 配器 ”( bump-pointer allocator ), 
下 面 给 出 其 伪 代 码 。 其 中 用 天 花 板 指 针 来 保护 空闲 空间 耗 尽 这 个 边界 条 件 。 


typedef struct Allocator{ 
void* free; 
void* ceiling; 

} Allocator; 


Object* object_alloc(int size, Allocator* allocator) 


int free =(int)allocator->free; 


int ceiling = (int) allocator->ceiling; 
int new_free = size + free; 
if ( new_free > ceiling) 


return null; 


allocator->free = (void*)new_free; 
return (Object*) free; 
} 


有 了 连续 空闲 空间 ， 容 纳 大 对 象 分 配 也 变 得 很 


5.8.3 ”空间 列表 与 分 配 位 图 


对 于 非 移动 式 GC 来 说 ， 跳 增 指针 分 配 很 难 实现 。 回 收 之 后 ,空闲 空间 可 能 很 快 就 会 碎片 化 
为 很 多 小 块 。 非 移动 式 GC 通常 把 空闲 块 组 织 为 空闲 列表 。 新 一 次 分 配 从 列表 中 选择 一 个 满足 斥 
才 要 求 的 块 。 如 果 这 个 块 比 对 象 要 大 ,分配 之 后 的 剩余 部 分 还 可 以 放 回 空闲 列表 。 回 收 之 后 , E 
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新 构造 空闲 列表 。 


遍历 和 操作 列表 的 效率 要 比 跳 增 一 个 指针 低 得 多 ,一 个 类 似 于 对 记忆 和 集 的 牌 做 标记 的 解决 方 
案 是 , 不 使 用 专门 的 空闲 列表 数据 结构 ， 而 是 用 堆 中 的 某 些 位 来 指示 可 用 块 。 例 如， 这 个 实现 可 
以 使 用 页 头 作为 位 图 ， 其 中 一 位 对 应 页 中 某 个 单位 大 小 。 位 值 1 表示 这 个 单元 已 经 被 分 配 ，0 表 
示 它 是 可 用 的 。 某 些微 处 理 器 可 以 用 单条 指令 确定 一 个 字 中 的 第 一 个 1 或 0 的 位 置 , 这 可 以 用 于 
检查 位 图 ， 以 快速 找到 页 中 的 空闲 单元 。 


5.8.4 ”离散 大 小 列表 


为 了 加 速 非 移动 式 GC 的 分 配 ， 更 常用 的 方法 是 使 用 离散 大 小 列表 ， 而 不 是 空闲 列表 。 其 思 
路 是 把 堆 组 织 为 块 ， 这 些 块 用 于 特定 大 小 的 对 象 。 这 个 大 小 叫 作 块 的 “ 槽 位 大 小 "。 一 个 块 只 能 
持 有 和 它 的 槽 位 同等 大 小 的 对 象 。 块 的 槽 位 大 小 从 一 个 Os 比如 8 字 节 , 直到 一 个 大 的 
值 ， 比 如 1KB， 以 固定 或 可 变 大 小 递增 。 对 象 会 被 分 配 在 最 合适 槽 位 大 小 的 块 中 , 也 就 是 说 , 大 
于 等 于 对 象 大 小 的 最 接近 值 。 大 于 最 大 模 位 大 小 的 对 象 会 单独 分 要， 而 不 是 放 在 块 中 。 
用 程序 分 配 某 个 大 小 的 对 象 时 ,如 果 没 有 最 合适 槽 位 大 小 的 空闲 块 可 用 , 就 从 全 局 空闲 
aa 


当 回收 被 触发 的 时 候 ， 可 能 某 些 槽 位 大 小 的 块 有 许多 , 却 没 有 其 他 槽 位 大 小 的 块 。 回 收 完成 
之 后 ， 有 些 块 中 可 能 不 再 有 活跃 对 象 。 可 以 把 这 些 块 返还 给 全 局 空间 空间 。 


在 块头 (block header ) 中 ， 有 一 个 位 图 指示 这 个 块 空间 使 用 或 对 象 分 配 的 状态 ， 其 中 一 个 位 
(或 者 一 组 位 ) 对 应 一 个 槽 位 。 如 果 一 个 位 值 为 1， 对 应 的 权 位 已 经 分 配给 某 个 对 象 ; 否则 它 就 
是 空闲 的 。 


5.8.5 ”标记 位 与 分 配 位 


在 回收 之 后 , 一 个 块 中 只 有 活路 对象， 应 该 在 位 图 中 反映 它们 的 状态 指示 空间 使 用 情况 。 也 
就 是 说 ， 回 收 之 后 ， 持 有 活跃 对 象 的 槽 位 应 该 在 修改 器 执行 之 前 置 起 它 的 分 配 位 。 


如 果 对 象 追 踪 也 用 块头 位 图 指示 对 象 标记 状态 , 那么 回收 之 后 , 用 于 活跃 对 象 标记 的 这 些 位 
在 应 用 程序 执行 之 前 可 以 用 来 表示 对 象 分 配 状态 。 基 于 这 一 观察 结果 , 一 个 自然 而 然 的 设计 就 是 
在 回收 之 后 把 这 些 标记 位 重用 为 分 配 位 。 这 个 设计 中 ， 每 个 槽 对 应 两 位 ， 一 个 用 作 分 配 位 ， 另 一 
个 用 作 标 记 位 。 一 次 回收 之 后 ， 它 们 的 角色 对 调 。 


这 些 位 的 使 用 方式 如 下 。 

(1) 一 次 回收 之 后 ， 除 了 一 些 分 配 位 设 为 1， 表 示 这 些 槽 位 已 经 被 占用 以 外 ， 位 图 的 其 余 所 
有 位 都 设 为 0。 在 执行 过 程 中 ， 随 着 块 中 分 配 更 多 的 对 象 ， 更 多 的 分 配 位 被 设置 为 1。 
(2) 发 生 回收 后 ，GC 追踪 对 象 的 时 候 使 用 标记 位 。 位 值 为 1 表示 对 应 的 槽 位 持 有 一 个 活跃 

XR. 
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(3) 对 象 追踪 结束 后 , 所 有 的 活路 对 象 都 标记 在 位 图 中 。 标记 位 值 为 0 的 槽 位 持 有 死亡 对 象 ， 
可 以 被 回收 。GC 清除 这 些 槽 位 的 分 配 位 。 这 就 有 效 地 执行 了 “清除 ”动作 。 

(4) 回收 结束 之 后 ,应 用 程序 执行 恢复 之 前 ，GC 交换 分 配 位 和 标记 位 的 角色 。 也 就 是 说 ,在 
接 下 来 的 应 用 程序 执行 过 程 中 ， 把 标记 位 用 作 分 配 位 。 然 后 过 程 回 到 步骤 (1)。 


图 5-8 展示 了 这 个 设计 的 步骤 。 


[| ie 分 配 位 。 每 槽 两 位 GHAR) 
标记 前 ， 只 有 一 些 分 配 位 值 为 1， 它 们 的 位 对 为 01 ， 否 则 为 00 








标记 后 : 有 的 标记 位 值 为 1， 它 们 的 位 对 为 11， 否 则 为 00 或 01 














Scan 交换 分 配 位 和 标记 位 的 角色 
加 "Eelelolelo felo fol 


图 5-8” 槽 位 大 小 相同 的 块 的 位 图 设计 








5.8.6 ”线程 局 部 分 配 


跳 增 指针 分 配 只 可 用 于 空闲 空间 属于 单个 线程 的 情况 。 如 果 有 多 个 线程 , 那么 分 配 应 该 是 线 
程 安全 的 。 指 针 跳 增 必须 修改 为 原子 化 操作 ， 如 以 下 伪 代 码 所 示 。 


Object* object_alloc(int size, Allocator* allocator) 
{ 
int ceiling = (int) allocator->ceiling; 
int free, new_free; 
do{ 
free = allocator->free; 
new_free = size + free; 
if ( new_free > ceiling) 
return null; 





bool ok = CompareExchange(&allocator->free, free, new_free); 
jwhile( !ok ); 


return (Object*) free; 
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为 每 个 对 象 分 配 使 用 原子 指令 代价 过 于 昂贵 。 一 个 常见 的 解决 方案 是 只 对 块 分 配 使 用 原子 操 
Es 每 个 线程 从 全 局 空闲 空间 中 用 原子 指令 抓 取 一 个 空闲 块 , 然后 在 块 中 用 跳 增 指针 进行 对 象 分 
配 ， 不 用 原子 操作 。 这 个 块 是 线程 局 部 的 ， 用 于 分 配 。 


组 织 为 离散 大 小 列表 的 堆 也 可 以 从 线程 局 部 块 中 获 益 。 每 个 块 属于 单个 线程 ,用 于 对 象 分 配 。 
否则 ， 多 个 线程 就 必须 使 用 原子 指令 ， 在 共享 块 中 竞争 得 到 一 个 槽 位。 


线程 局 部 块 的 尺寸 不 能 太 小 。 从 全 局 空闲 空间 中 分 配 一 个 块 需要 原子 指令 。 频繁 的 块 分 配 会 
削弱 线程 局 部 块 的 优势 。 然 而 ， 块 尺寸 也 不 能 太 大 ,否则 如 果 应 用 程序 中 有 很 多 线程 ， 有 些 线 程 
可 能 并 不 活跃 分 配对 象 ， 那 么 就 会 浪费 其 中 只 有 少数 几 个 对 象 的 块 空间 。 


5.8.7 ”移动 式 GC 与 非 移动 式 GC 的 混合 


尽管 离散 大 小 列表 支持 快速 分 配 , 但 GC 有 可 能 无 法 找到 具有 最 合适 槽 位 大 小 的 空闲 块 用 于 
对 象 分 配 ， 同 时 在 其 他 尺寸 槽 位 的 块 中 仍 有 大 量 空闲 槽 位 。 这 可 能 引入 以 下 3 种 内 存 碎 片 。 


O 块 内 碎片 。 如 果 块 的 槽 位 大 小 不 是 按照 一 个 字 的 大 小 递增 ， 那 么 一 个 块 的 槽 位 大 小 可 能 
大 于 分 配 在 其 中 的 对 象 大 小 。 于 是 每 个 槽 位 都 可 能 浪费 一 个 或 多 个 字 的 空间 。 

O 块 间 碎片 。 应 用 程序 的 对 象 大 小 可 能 分 布 并 不 均匀 ， 所 以 有 些 槽 位 大 小 可 能 使 用 大 量 
块 ， 而 其 他 大 小 的 槽 位 可 能 只 有 很 少 的 对 象 。 即 使 某 个 槽 位 大 小 只 有 一 个 对 象 ， 也 要 为 
这 个 本 位 分 配 一 个 块 。 于 是 这 个 块 空间 就 浪费 了 。 

口 线程 间 碎 片 。 每 个 线程 抓 取 自己 的 线程 局 部 块 。 一 个 线程 可 能 大 量 分 配 某 个 大 小 的 对 
象 ， 而 另 一 个 线程 可 能 分 配 很 少 的 同样 大 小 的 对 象 。 于 是 这 个 块 空间 就 浪费 了 ， 因 为 这 
些 块 并 不 是 线程 间 共 享 的 。 

如 果 块 很 大 的 话 ， 碎 片 问题 就 更 加 严重 。 为 了 解决 这 个 问题 ， 可 以 向 非 移 动 式 GC 引入 移动 

式 算法 。 

移动 式 GC 和 非 移 动 式 GC 混合 有 以 下 几 种 常用 的 方式 。 

针对 不 同 回收 : 一 种 混合 方式 是 在 不 同 的 回收 中 使 用 不 同 的 算法 。 例 如 ， 在 几 轮 标记 清 

除 回收 之 后 ， 空 间 碎片 问题 非常 严重 ， 这 时 候 GC 可 以 使 用 一 个 压缩 回收 来 打包 同样 模 

位 大 小 的 块 。 

压缩 回收 把 同样 大 小 的 对 象 移动 到 那些 同样 槽 位 大 小 的 半 满 的 块 中 。 压 缩 之 后 ， 对 于 每 

个 槽 位 大 小 ， 只 有 一 个 块 是 半 满 的 。 所 有 其 他 同样 大 小 构 位 的 块 要 么 是 满 的 ， 要么 是 空 

的 。 空 的 块 会 返还 给 全 局 空闲 空间 。 这 有 助 于 缓解 碎片 问题 。 

针对 不 同 堆 空间 : 移动 算法 和 非 移动 算法 也 可 以 合作 管理 堆 的 不 同 部 分 。 比 如 在 分 代 式 

GC 中 ， 可 以 对 年 轻 一 代 应 用 移动 算法 ， 对 成 熟 一 代 应 用 非 移 动 算法 。 

这 是 合理 的 。 年 轻 一 代 通 常 死 亡 率 更 高 。 这 意味 着 一 次 回收 中 , 年轻 一 代 的 生存 对 象 数 

量 通 常 比较 小 。 移动 少量 对 象 留 下 大 量 空闲 空间 是 值得 的 。 但是, 成熟 一 代 只 用 为 年 轻 
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一 代 中 存活 的 对 象 分 配 ， 这 比 起 修改 器 的 对 象 分 配 要 少 得 多 。 因 此 ， 使 用 非 移 动 式 GC 
处 理 成 熟 一 代 的 碎片 问题 是 可 以 接受 的 。 

针对 不 同 对 象 : 移动 式 GC 还 可 能 需要 非 移动 式 GC 的 帮助 ， 因 为 它 无 法 简单 支持 某 些 
语言 所 需 的 保守 式 GC。 那 些 语言 没有 精确 根 集 。 例 如 ， 它 们 可 能 在 整数 中 保存 一 个 对 
象 引 用 。GC 扫描 应 用 程序 执行 上 下 文 的 时 候 ， 不 得 不 保守 地 把 任何 看 起 来 像 引用 的 数 
据 当 作 引 用 ,既然 这 个 含义 模糊 的 引用 可 能 实际 上 是 整数 ， 那 就 不 应 该 移动 这 些 模 糊 引 
用 指向 的 对 象 ， 否 则 可 能 会 错误 地 修改 棍 位 中 的 整数 。 一 个 解决 方案 是 允许 在 移动 式 
GC 中 锁定 对 象 ， 这 样 模糊 引用 指向 的 对 象 就 都 被 锁定 了 ， 也 就 是 不 能 移动 。 这 也 是 移 
动 式 GC 与 非 移动 式 GC 的 一 种 混合 。 
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多 数 编程 语言 或 者 以 语言 构件 ( 比如 Java 中 的 Thread ), 或 者 以 外 部 库 ( 比如 C 中 的 Pthreads ) 
的 形式 来 支持 线程 ( 即 多 线程 编程 )。 因 为 语言 构件 作为 一 种 语言 特性 ， 它 的 语义 在 可 移植 性 和 
安全 性 方面 能 够 得 到 保证 , 所 以 是 支持 线程 更 好 的 方式 。 某 些 人 研究 者 认为 把 线程 实现 为 库 不 可 能 
没有 任何 问题 。 

如 果 一 个 语言 有 线程 构件 ， 那 么 实现 其 支持 是 虚拟 机 ( VM ) 的 责任 。 因 为 VM 通常 作为 用 
户 应 用 程序 运行 ， 不 能 访问 系统 任务 调度 ， 所 以 VM 实现 通常 要 依赖 于 操作 系统 ( OS ) 功能 来 获 
得 完整 的 线程 支持 ， 否 则 只 能 实现 用 户 级 线程 ( green threads 或 类 似 的 协 程 )， 无 法 充分 利用 系统 
能 力 。 不 同 OS 中 的 线程 应 用 程序 接口 (API ) 可 能 也 有 所 不 同 , 但 它们 都 提供 了 类 似 的 基本 功能 
最 常见 的 功能 是 线程 创建 、mutex ( 双向 同步 )、 条 件 变量 ( 单 向 同步 ) 和 原子 操作 。 我 们 以 SVM 
为 例 来 讨论 如 何 用 这 些 常 用 功能 实现 Java 线程 。 首 先 我 们 应 该 回答 线程 是 什么 。 


6.1 什么 是 线程 


线程 就 是 一 个 执行 控制 流 。 它 是 一 个 只 对 控制 流 机 器 有 效 的 概念 ,当前 几乎 所 有 处 理 需 都 是 
控制 流 机 器 。 

控制 流 是 一 个 指令 序列 的 执行 。 为 了 表示 控制 流 , 需要 两 个 核心 实体 : 程序 计数 顺和 栈 指针 。 
程序 计数 器 指向 序列 中 要 执行 的 下 一 条 指令 。 栈 指针 指向 存储 临时 执行 结果 的 下 一 个 位 置 。 程序 
计数 器 和 栈 指针 合 在 一 起 可 以 唯一 标识 一 个 执行 控制 流 。 它 们 通常 不 能 与 其 他 线程 共享 ; 否则 ， 
混乱 的 指令 或 者 混乱 的 数据 都 可 能 会 导致 不 正确 的 结果 。 其 他 所 有 计算 资源 都 可 以 在 线程 间 共 
享 ， 比 如 堆 、 代 码 和 处 理 器 ,因为 这 些 资源 并 不 是 必须 按 顺 序 访问 的 。 由 于 程序 计数 器 和 栈 指针 
对 线程 具有 唯一 性 ， 它 们 也 被 合 称 为 线程 上 下 文 。 

线程 上 下 文 意味 着 ,如果 一 个 系统 提供 了 线程 支持 , 那么 它 至 少 应 该 提供 一 种 方法 ,可 以 把 
一 个 线程 上 下 文 与 另 一 个 区 分 开 来 。 独 立 的 线程 上 下 文 可 以 由 软件 、 硬 件 或 者 二 者 混合 实现 。 如 
果 线 程 上 下 文 在 处 理 需 硬件 中 提供 ,那么 线程 称 为 硬件 线程 。 根 据 设 计 的 不 同 , 不 同 的 硬件 线程 
可 以 共享 同一 个 处 理 器 流水 线 ， 也 可 以 使 用 不 同 的 流水 线 。 前 者 称 为 同步 多 线程 (simultaneous 
multithreading, SMT )。 超 线程 ( Hyperthreading, HT ) 是 SMT 的 一 种 实现 。 一 个 控制 流 处 理 器 
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必须 提供 至 少 一 个 硬件 线程 上 下 文 ， 否 则 就 没有 控制 流 了 。 

如 果 处 理 器 只 有 一 个 线程 上 下 文 , 那 它 就 不 支持 硬件 多 线程 。 可 以 由 软件 来 提供 多 线程 。 也 
就 是 说 ， 多 个 软件 线程 可 以 复 用 (multiplex ) 这 同一 个 硬件 线程 上 下 文 。 当 一 个 软件 线程 被 调度 
运行 的 时 候 , 它 的 上 下 文 会 被 加 载 到 硬件 线程 上 下 文中 。 如 果 它 被 从 处 理 器 上 调度 出 去 , 那么 它 
的 上 下 文 会 被 存储 在 别处 ， 给 下 一 个 调度 进来 的 软件 线程 让 路 。 这 称 为 上 下 文 切 换 。 

既然 多 个 软件 线程 可 以 共享 同一 个 硬件 上 下 文 ， 那 就 不 难 想象 ， 一 个 软件 线程 上 下 文 也 可 以 被 
另 一 级 的 多 个 软件 线程 复 用 。 概 念 上 来 说 ， 可 以 构建 无 限 多 等 级 的 软件 线程 ， 每 个 高 层 线程 复 用 它 
下 一 级 线程 的 上 下 文 。 如 果 多 个 高 层 线 程 在 下 一 级 线程 中 复 用 同一 个 线程 上 下 文 , 就 称 为 M : 1 映射 。 

也 可 以 构造 1 : 1 映射 和 M:N 映射 。 它们 只 是 M : 1 映射 的 特殊 形式 。1 : 1 映射 适用 于 低 
层 线程 功能 与 高 层 线程 相当 , 但 没有 映射 的 话 , 高 层 线程 就 无 法 直接 使 用 这 些 功能 的 情况 。 例如， 
低层 和 高 层 可 以 分 别 是 从 硬件 到 软件 、 从 内 核 到 用 户 空间 、 从 OS 到 VM， 等 等 。 

M :NN 映射 是 指 多 个 线程 复 用 多 个 上 下 文 的 情况 。 例 如 ， 一 个 多 核 处 理 器 有 多 个 硬件 线程 上 
下 文 ,每 个 核 上 都 有 一 个 。 当 它 执 行 多 个 软件 线程 的 时 候 , 每 个 软件 线程 可 以 被 调度 到 任何 一 个 
核 上 。 结 果 就 是 M 个 软件 线程 在 N 个 硬件 核 上 运行 。 

由 于 线程 支持 多 个 层级 ， 当 讨论 到 一 个 线程 的 时 候 ， 应 该 指出 它 位 于 哪个 层级 上 。 一 个 层级 
上 的 单个 线程 可 能 包含 更 高 层级 上 的 多 个 线程 。 

现实 中 没有 必要 构造 太 多 层级 的 线程 ， 通 常 不 超过 3 级。 第 2 级 共享 第 1 级 的 硬件 上 下 文 ， 
第 3 级 共享 第 2 级 的 软件 上 下 文 。 

在 Linux 设 计 中 ， 内核 线程 (软件 线程 ) 以 M : NWN 映射 复 用 硬件 上 下 文 ，glibc 的 用 户 线 程 以 
1 : 1 映射 使 用 内 核 线程 上 下 文 有 些 系统 在 用 户 线程 和 内 核 线程 之 间 使 用 M : N 或 者 M : 1 映射 ， 
比如 GNU Portable Threads 和 Windows Fiber。 但 是 这 些 特性 要 么 不 常用 ， 要 么 只 用 于 特殊 情况 。 

注意 , 在 这 里 进程 是 一 个 无 关 紧 要 的 概念 , 尽管 进程 常常 和 线程 相 混淆 ,线程 主要 是 关于 “ 执 
行 的 控制 流 ”， 而 进程 主要 是 关于 “内 存 空间 隔离 ”。 如 果 两 个 线程 运行 在 隔离 的 内 存 空间 中 ， 可 
以 认为 它们 是 运行 在 不 同 的 进程 中 。 在 Linux 内 核 中 ， 因 为 所 有 的 任务 共享 内 核 内 存 空间 ， 所 以 
在 严格 意义 上 说 , 在 内 核 级 别 中 没有 进程 ， 只 有 内 核 线程 。 进 程 只 存在 于 用 户 空间 ， 用 户 空间 为 
每 个 进程 建立 了 隔离 的 虚拟 内 存 空间 。 在 内 核 上 下 文中 讨论 进程 也 不 是 错误 的 , 但 这 里 进程 实际 
上 是 指 1 : 1 映射 到 用 户 进程 的 内 核 线程 。 


6.2 ”内 核 线程 与 用 户 线程 

线程 设计 中 ， 紧 接着 线程 上 下 文 问题 之 后 的 第 二 个 问题 就 是 如 何在 线程 间 切 换 线程 上 下 文 ， 
也 就 是 线程 调度 的 设计 。 

如 果 线程 完全 是 在 软件 中 实现 的 ,那么 线程 调度 就 是 在 软件 中 执行 的 。 为 了 避免 一 个 线程 长 
时 间 运行 占用 线程 上 下 文 , 以 至 于 俄 死 其 他 线程 , 软件 线程 设计 必须 保证 存在 执行 切换 操作 的 时 
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机 。 一 个 简单 的 方法 是 利用 普通 硬件 中 断 。 一 旦 线程 收 到 一 个 硬件 中 断 〈 多数 是 定时 器 中 断 )， 
就 陷 和 人 中断 处 理 孔 数 , 然后 在 处 理 函数 中 , 通过 保存 当前 线程 上 下 文 并 加 载 下 一 个 线程 上 下 文 来 
实现 线程 调度 。 从 中 断 处 理 函数 中 恢复 执行 时 ， 就 继续 执行 新 的 线程 。 

有 时 候 ， 定 时 器 中 断 还 不 够 。 在 M : 1 映射 中 ， 高 层级 的 所 有 软件 线程 在 低层 级 上 都 被 认为 
是 同一 个 线程 。 因此, 它们 在 低层 级 上 是 作为 同一 个 线程 被 调度 的 。 这 意味 着 它们 一 起 共享 低层 
级 上 单个 线程 的 时 间 片 。 如 果 低 层级 线程 被 调度 出 处 理 器 , 它 包 含 的 所 有 高 层级 线程 也 就 都 无 法 
继续 执行 。 这 是 M : 1 映射 的 一 个 普遍 问题 。 

因此 ， 如 果 当 前 线程 休眠 〈 也 就 是 被 调度 出 处 理 融 )， 那 么 在 定时 澡 打 断 休 眠 之 前 ， 就 无 法 
调度 执行 其 他 任何 线程 。 底 层 调度 器 只 能 看 到 一 个 休眠 中 的 线程 , 它 不 知道 有 很 多 就 绪 的 线程 共 
享 同 一 个 线程 上 下 文 〈 以 及 同一 个 时 间 片 )。 这 不 是 期 望 的 结果 ， 因 为 这 时 候 计 算 资 源 在 空闲 中 
被 浪费 掉 了 , 同时 又 有 一 些 线程 在 等 待 运行 。 一 个 直观 的 解决 方案 是 , 如 果 一 个 线程 要 进入 休眠 ， 
它 会 自愿 调用 调度 器 。 然 后 调度 右 就 可 以 切换 上 下 文 到 下 一 个 线程 。 这 被 称 为 让 行 ( yield )， 类 
似 于 应 用 程序 触发 阻塞 系统 调用 之 前 的 垃圾 回收 轮 询 点 。 


休眠 线程 让 行 后 , 它 只 让 所 在 层级 的 线程 调度 需 看 来 处 于 休眠 状态 。 在 低层 级 线程 调度 天 有 眼 
H, 可 能 看 到 这 个 线程 继续 执行 而 没有 休眠 ， 因 为 它 把 所 有 的 高 层 线程 看 作 同 一 个 单独 线程 。 BH 
塞 操作 的 让 行 需要 在 阻塞 操作 的 实现 中 支持 。 例 如 , 现在 休 眼 操作 需要 两 个 动作 : 一 个 是 把 这 个 
线程 调度 出 上 下 文 ， 并 置 为 休眠 状态 ; 另 一 个 是 调度 男 一 个 线程 进入 上 下 文 。 换 句 话说 ,高 层 的 
阻塞 操作 实际 上 在 低层 看 来 是 非 阻塞 的 。 

非 阻塞 操作 对 于 有 大 量 异 步 任务 ( 特别 是 输入 /输出 操作 ) 的 计算 来 说 , 可 以 通过 M : 1 映射 
有 效 地 提高 任务 并 发 性 ,但 仍然 不 能 解决 资源 ( 特别 是 多 核资 源 ) 的 利用 问题 。 不 管 高 层 调度 天 
设计 得 如 何 之 好 , 也 只 能 项 多 保证 共享 的 这 一 个 时 间 片 尽量 不 被 浪费 。 它 不 能 比 一 个 单独 底层 线 
程 得 到 更 多 的 时 间 片 。 只 有 最 底层 线程 能 控制 所 有 的 可 用 时 间 片 ， 这 就 是 内 核 线程 。 如 果 一 个 高 
层 线程 想 要 尺 可 能 多 地 使 用 资源 , 它 就 必须 利用 内 核 线 程 的 支持 。 这 也 就 是 为 什么 通常 在 内 核 线 
程 之 上 只 有 不 超过 一 层 的 额外 线程 ， 除 非 上 层 线程 用 1 : 1 映射 保留 了 内 核 线程 的 调度 优势 。 内 
核 线程 级 之 上 的 M: NRA M: 1 映射 在 多 核资 源 利用 方面 没有 多 大 益处 , 却 增加 了 设计 复杂 性 . 


图 6-1 展示 了 当前 OS 中 一 个 常见 的 线程 设计 。 


本 地 线程 
用 户 空间 











图 6-1 现代 操作 系统 中 常见 的 线程 设计 
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这 个 线程 设计 有 3 层 。 底 层 是 处 理 器 中 的 硬件 线程 。 每 个 核 有 一 个 或 多 个 线程 上 下 文 。 中 间 
层 是 复 用 硬件 线程 的 内 核 线程 。 如 果 硬 件 是 单 核 单 线程 处 理 侣 ， 那 么 内 核 线 程 到 硬件 线程 是 M : 1 
映射 。 否 则 ， 如 果 硬 件 有 多 个 上 下 文 ， 那 么 就 是 M : NWN 映射 。 这 个 映射 由 OS 内 核 调 度 器 实现 。 

顶层 是 运行 在 用 户 空间 的 本 地 线程 。 本 地 线程 和 内 核 线程 之 间 的 映射 通常 是 1 : 1， 原因 前 
文 已 经 介绍 过 。 这 一 层 映射 由 glibc 用 对 内 核 线程 的 用 户 封装 来 实现 。 本 地 线程 通常 被 认为 是 OS 
在 用 户 空间 这 一 层 提 供 的 线程 ， 因 此 有 时 候 也 称 为 OS 线程 。 

本 地 线程 之 上 的 线程 库 通常 称 为 用 户 层 线程 或 者 绿色 线程 ， 尽 管用 户 层 线程 在 基 些 场景 下 有 
自己 的 优势 , 但 现在 已 经 很 少 使 用 了 。 目前 在 异步 编程 中 应 用 较 多 的 协 程 ( coroutine ) 可 归于 此 类 。 

例如 , Æ M: 1 映射 用 户 层 线程 设计 中 ， 多 个 用 户 线程 永远 不 会 在 多 个 核 上 并 行 运 行 ， 因 为 
在 内 核 级 或 者 硬件 级 上 它们 只 是 同一 个 线程 , 共享 低层 的 同一 个 线程 上 下 文 。 那么 它们 的 用 户 线 
程 编程 也 就 无 须 使 用 原子 指令 。 出 于 这 个 原因 ，M : 1 映射 有 时 候 也 被 用 作 脚 本 语言 VM 的 简单 
快捷 线程 实现 ， 比 如 Ruby。 


另 一 个 M : 1 映射 用 户 层 线程 设计 的 例子 是 输入 输出 (1/0 ) 密集 型 环境 。 用 户 层 线程 可 以 
向 多 个 运行 中 任务 提供 非 阻塞 1O 操作 。 这 些 任务 实际 上 运行 在 同一 个 本 地 线程 中 ， 不 能 在 多 核 
处 理 器 上 真正 地 并 发 运行 。 在 这 种 环境 下 ,这 不 是 一 个 问题 ， 因 为 这 些 任务 不 是 CPU 密集 型 的 ， 
而 是 大 部 分 时 间 在 等 待 WO。 共享 一 个 本 地 线程 的 时 间 片 就 足够 了 。Nodeijs 使 用 这 个 模型 。 


6.3 VM 线程 到 OS 线程 的 映射 


要 实现 安全 语言 线程 构件 ， 最 高 效 的 方法 是 在 OS 线程 ( 本 地 线程 ) 和 VM 线程 之 间 使 用 1 : 1 
映射 。 其 他 映射 通常 不 会 有 更 高 价值 ， 除 非 在 某 个 领域 有 特殊 的 语言 要 求 。 

Java 线程 和 传统 ( 及 经 典 ) 线程 的 定义 方式 是 一 样 的 ， 正 如 Java 语 言 规范 中 所 言 :“Java 虚 
拟 机 可 以 支持 同时 运行 的 多 个 线程 。 这 些 线程 独立 执行 代码 ,以 操作 处 于 共享 主 内 存 中 的 值 和 对 
象 。 线 程 可 以 通过 多 硬件 处 理 器 、 单 硬件 处 理 器 时 间 分 片 ， 或 者 通过 多 硬件 处 理 器 时 间 分 片 来 支 
持 。” 就 像 JVM 规范 中 定义 的 , 每 个 JVM 线程 有 自己 的 pc( 程序 计数 器 ) 寄 存 器 和 JVM 栈 。JVM 
有 一 个 堆 ， 由 所 有 JVM 线程 共享 。 这 个 定义 使 得 1 : 1 映射 成 为 最 佳 选择 。 


下 面 的 代码 是 一 个 支持 JVM 线程 的 VM 线程 数据 结构 的 常见 定义 。 


struct VM_Thread { 


void* os_thread; // OS 线程 句柄 
Object* java_thread; // JVM RAL 4) 44 
uint32 tid; // IVM 线程 标识 符 
volatile int status; // IM 线程 状态 
int priority; // 线程 优先 级 


bool is_daemon; / GA daemon 


/ 
// 其 他 额外 的 字段 会 在 后 面 介绍 
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Java API 规 范 中 规定 ， 调 用 Thread. start () 会 启动 线程 从 Thread 实例 的 run () 方 法 开始 
执行 。 所 以 我 们 需要 实现 两 个 封装 ， 一 个 用 于 Thread.run() ， 另 一 个 用 于 Thread.start ()。 
下 面 的 伪 代 码 给 出 了 一 个 概念 设计 。 


Thread.start () 启 动 线程 执行 。 


// 调用 这 个 方法 时 ， 参 数 为 java Thread 对 象 
void thread start (Object* jthread) 
{ 
// 创建 VM_Thread 数据 结构 
VM_Thread* kthread = vmthread_data_init( ); 


if ( !jthread || !kthread) { 
vm_throw_exception("NullPointerException") ; 
} 


if (kthread->status != THREAD _STATE_STARTED) { 
vm_throw_exception("IllegalThreadStateException") ; 

} 

// 连接 Java fo VM 线程 数据 /对 象 

bind_java_and_vm_thread(kthread, jthread) ; 

set_init_java_thread_priority (jthread) ; 

// 这 里 锁定 ， 在 thread_run () 中 解锁 

global_thread_lock() ; 

// 创建 线程 从 thread_run() 执 行 

kthread->os_thread = 
os_thread_create(thread_run, kthread); 


return; 


} 
Thread. run () 在 一 个 新 线程 上 下 文中 由 Thread.start () 调 用 。 


unsigned STDCALL thread_run(VM_Thread* kthread ) 
{ 
// 设置 线程 状态 
kthread->status = THREAD_STATE_RUNNING; 
// 锁定 部 分 在 thread_start () 中 
global_thread_unlock(); 


// 找 出 Thread.run() 中 的 方法 结构 
vm_string* sname = string_pool_lookup ("run"); 
vm_string* sdesc = string_pool_lookup("()V"); 
Object* jthread = kthread->java_thread; 
vm_class* thread_class = object_get_class (jthread); 
vm_method* km_thread_run = 

class_lookup_method( thread_class, jname, jdesc); 


// 4f Thread. run() 
vm_execute_java_method( km_thread_run, jthread, NULL); 


// 退出 线程 
destroy_thread_data(kthread) ; 
return 0; 
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下 面 是 上 述 概念 代码 中 使 用 的 线程 状态 定义 。 


enum thread_state{ 


THREAD_STATE_UNKNOWN, // 状态 为 未 知 
THREAD_STATE_ZOMBIE, // 执行 完毕 
THREAD_STATE_RUNNING, // 线程 活跃 中 
THREAD_STATE_SLEEPING, // 线程 休眠 中 
THREAD_STATE_MONITOR, // 在 一 个 monitor 上 等 待 





THREAD_STATE_WAIT, // 在 一 个 对 象 上 等 待 
THREAD_STATE_STARTED // 启动 后 运行 前 
} 


在 这 个 线程 状态 定义 中 ,这 些 状态 是 互 斥 的 ， 有 时 这 不 够 高 效 , 或 难以 理解 。 例 如 ， 当 应 用 
程序 检查 一 个 线程 是 否 存 活 的 时 候 ，VM 对 于 除 UNKNOWN 和 ZoMBIE 之 外 的 所 有 状态 都 会 返回 
真 。 在 某 些 其 他 的 JVM 设计 中 ， 比 如 Apache Harmony， 线 程 状态 用 位 标识 符 定义 ,可 以 将 其 组 
合 起 来 。 实 际 上 它 把 线程 状态 设计 为 多 个 层次 : 一 层 是 运行 状态 ( 例如 SLEEPING, RUNNING ), 
一 层 是 执行 代码 类 型 ( 例如 Is_NATIVE), 还 有 一 层 表示 组 合 状 态 (例如 ALIVE )。 


在 上 面 线程 数据 结构 和 状态 的 示例 代码 中 ， 有 一 些 关 于 monitor 和 wait 的 数据 ， 这 些 是 接 下 
来 将 要 介绍 的 基本 线程 构件 。 


6.4 同步 构件 


多 个 线程 要 相互 合作 ， 需 要 至 少 两 个 基本 同步 构件 。 一 个 用 来 支持 共享 数据 的 互 斥 访问 , 另 
一 个 用 来 支持 共享 数据 的 条 件 访问 。 前 者 通常 用 锁 实 现 ( 即 mutex )。 后 者 也 是 必要 的 ， 因 为 只 
用 互 斥 无 法 高 效 地 实现 条 件 访问 。 以 经 典 的 生产 者 -消费 者 问题 为 例 ， 共 享 队列 未 占 满 的 时 候 ， 
生产 者 只 入 队 一 个 项 目 。 下 面 的 代码 显然 是 不 正确 的 。 


while( true ){ 
// 生产 者 锁 住 队列 进行 检查 
lock( Queue ); 
while( Queue is full ){ 
continue; 





} 
enqueue (Queue, Item); 
unlock( Queue ); 


} 
这 段 代 码 不 正确 的 原因 是 ， 当 生产 者 锁 住 队列 之 后 ， 消 费 者 就 不 能 访问 队列 来 消费 项 目 ， 


下 面 的 代码 也 不 正确 。 
while( true ){ 
// 生产 者 检查 队列 ， 不 用 锁 


while( Queue is full ){ 
continue; 
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} 

lock( Queue ); 
enqueue (Queue, Item); 
unlock( Queue ); 


} 

上 上面 的 代码 只 把 入 队 操 作 放 到 临界 区 , 而 把 条 件 检 查 放 在 外 面 。 当 一 个 生产 者 发 现 条 件 为 真 ， 
然后 继续 进入 临界 区 的 时 候 , 另 一 个 生产 者 可 能 执行 同样 的 操作 , 并 在 当前 生产 者 之 前 把 一 个 项 
目 人 队 ， 放 到 最 后 一 个 空位 置 上 。 然 后 当前 生产 者 会 继续 运行 ， 向 一 个 已 满 队 列 人 队 一 个 项 目 ， 
这 是 不 正确 的 。 

要 避免 这 样 的 竞 态 条 件 , 条 件 检查 和 入 队 操作 都 应 该 被 锁 保 护 。 下 面 的 代码 给 出 了 一 个 正确 
的 解决 方案 。 


while( true ){ 
// 生产 者 锁 住 队列 进行 检查 
lock( Queue ); 
while( Queue is full ){ 
unlock( Queue ); 
lock( Queue ); 
} 
enqueue (Queue, Item); 
unlock( Queue ); 

} 

上 面 的 代码 语义 正确 ， 但 效率 不 高 ， 因 为 在 忙 循环 里 生产 者 解锁 队列 之 后 立即 又 锁 住 队 列 。 
消费 者 可 能 找 不 到 机 会 来 锁 住 队列 并 消耗 项 目 。 结果 生产 者 可 能 会 循环 很 长 时 间 , 却 只 做 了 无 用 
功 。 

更 高 效 的 设计 通常 是 在 性 循环 中 插入 一 个 yiela() 或 者 sleep (n) , n 为 毫秒 数 , 在 试图 再 
次 上 锁 之 前 向 其 他 线程 让 出 CPU 片 。 

while( true ){ 

// 生产 者 锁 住 队列 进行 检查 

lock( Queue ); 

while( Queue is full ){ 
unlock( Queue ); 
yield(); // 或 者 sleep (n) 等 一 会 
lock( Queue ); 

} 

enqueue (Queue, Item) ; 


unlock( Queue ); 
} 
这 个 设计 模式 比较 笨拙 , 不 能 灵活 处 理 各 种 不 同情 况 。 更 好 的 方案 是 让 线程 可 以 休眠 ,并 且 
只 在 条 件 满足 之 后 才 醒 来 ， 如 以 下 代码 所 示 。 
while( true ){ 
// 生产 者 锁 住 队列 进行 检查 
lock( Queue ) 


while( Queue is full ){ 
unlock( Queue ); 
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sleep_waiting( Queue is not full ); 
lock( Queue ); 
} 
enqueue (Queue, Item); 
unlock( Queue ); 
} 


通过 这 种 方式 ， 生 产 者 只 在 需要 的 时 候 工 作 ， 不 会 浪费 CPU 周期 。JVM 定义 了 监视 器 
(monitor ) 用 来 实现 互 斥 和 条 件 访问 。 


6.5 monitor 


monitor 由 mutex 和 条 件 变 量 组 成 。 


6.5.1 BF 


在 JVM 中 ， 每 个 对 象 都 与 一 个 monitor 关联 ， 线 程 用 字 节 码 指令 monitorenter 和 
monitorexit 来 锁 住 和 解锁 这 个 monitor, 这 个 锁 是 可 重信 的 , 意思 是 如 果 一 个 线程 多 次 锁 住 它 ， 
需要 解锁 同样 次 数 才 能 解除 锁定 效果 。Java 程序 中 的 每 个 同步 ( synchronized ) 块 或 方法 都 由 一 
对 monitorenter 和 monitorexit 在 块 /方法 的 入 口 点 和 出 口 点 封装 起 来 。 


为 了 支持 条 件 访问 ， 每 个 对 象 还 与 一 个 等 待 队列 关联 。 线 程 在 这 个 对 象 上 调用 wait () 就 会 
被 添加 到 这 个 队列 中 并 进入 休眠 ,然后 其 他 线程 在 这 个 对 象 上 调用 notify () 或 者 notifyAll () 
方法 时 ， 这 个 线程 会 被 唤醒 。 


回 到 经 典 的 生产 者 -消费 者 问题 ， 使 用 monitor 字 节 码 ， 其 概念 代码 如 下 所 示 。 
while( true ) { 
// 生产 者 锁 住 队列 进行 检查 
monitorenter( Queue ); 
while( Queue is full ){ 
monitorexit( Queue ); 
sleep _waiting( Queue ); 
monitorenter( Queue ); 
} 
enqueue (Queue, Item); 
monitorexit( Queue ); 


} 


使 用 关键 字 synchronized 取代 一 对 monitorenter 和 monitorexit， 可 以 把 这 段 代 码 
重 写 如 下 。 


while( true ){ 
// 生产 者 锁 住 队列 进行 检查 
synchronized( Queue ) { 
while( Queue.full() ){ 
monitorexit( Queue ); 
sleep _waiting( Queue ); 
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monitorenter( Queue ); 
} 


Queue.enqueue (Item) ; 


} 


6.5.2 条件 变量 


Java 中 wait () 操作 的 关键 点 是 ， 在 一 个 对 象 上 调用 wait O 的 线程 应 该 已 经 持 有 这 个 对 象 
monitor 的 锁 。wait () 操 作 原 子 化 地 释放 这 个 锁 ， 并 把 调用 者 线程 置 和 人 休眠 状态 。 一 旦 这 个 线程 
从 体 眠 中 被 唤醒 , 它 就 会 自动 锁 住 这 个 对 象 的 monitor。 因 此 , 对 象 上 的 wait O 实际 上 包含 以 下 
3 个 操作 

object.wait(): 

monitorexit( object ); 
sleep_waiting( object ); 
monitorenter( object ); 


通过 wait () 实现 生产 者 的 Java 代码 如 下 。 


while( true ) { 
synchronized( Queue ) { 
while( Queue.full() ){ 
Queue.wait(); 
} 
Queue. enqueue (Item); 


} 


一 个 Java 对 象 的 等 待 队列 与 这 个 线程 等 待 的 条 件 没有 关联 。 有 可 能 在 同一 个 对 象 等 待 的 多 
个 线程 等 待 的 是 不 同 的 条 件 。 检 查 等 待 条 件 是 否 为 真 ， 是 线程 醒 来 后 自己 的 责任 。 

在 生产 者 的 例子 中 ， 当 生产 者 从 oueue .wait () 方 法 返回 的 时 候 ， 它 必须 检查 Queue 是 否 
为 满 。 如 果 它 仍然 是 满 的 ， 那 么 这 个 线程 就 再 次 wait () o 否则 它 就 继续 执行 下 一 步 项 目 人 队 操 
作 。 这 个 线程 不 需要 担 ， 心 条 件 检查 和 人 和 队 动作 的 原子 化 问题 ， 因为 它 从 wait () 返 回 的 时 候 已 经 
持 有 锁 了 。 


当 一 个 线程 等 待 的 对 象 接收 到 通知 的 时 候 ， 这 个 线程 就 会 醒 来 。 当 其 他 线程 在 这 个 对 象 上 
调用 notify() 或 者 notifyaAll() 的 时 候 ， ee 如 果 等 待 线程 被 中 断 ， 线 程 也 会 
醒 来 。 


6.5.3 monitorenter 


要 在 JVM 中 实现 monitor， 关 键 是 维护 休眠 等 待 锁 或 条 件 的 线程 。 一 个 简单 的 解决 方案 是 用 
线程 列表 保存 这 些 信 息 。 图 6-2 展示 了 包含 monitor 支持 字段 的 线程 数据 结构 。 
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thread_state 
status 





Object* 
waited condition 





event* 
SIG NOTIFY 














图 6-2 IE JVM monitor 的 数据 结构 


每 个 线程 都 有 一 个 已 进入 的 monitor 的 列表 ( lockeq_obj_list )， 它 因 无 法 锁定 而 阻塞 的 
一 个 对 象 (blocked_lock )， 以 及 它 等 竺 条件 的 一 个 对 象 (waited_condition), 

我 们 用 对 象 头 元 数据 中 的 1 位 LOCK_BIT 来 指示 这 个 对 象 是 否 被 某 个 线程 锁 住 。 如 果 它 被 一 
个 线程 锁 住 ， 那 么 它 就 会 被 记录 在 这 个 线程 的 列表 locked_obj_list 中 。 列 表 
locked_obj_list 的 节点 类 型 如 下 。 


struct Locked_obj 

{ 
Object* jobject; // AEH monitor 对 象 
int recursion; // 重复 锁定 的 次 数 
Locked_obj* next; // 列表 中 的 下 一 个 节点 

} 


monitorenter 的 操作 语义 如 下 。 

O 步骤 1: 检查 monitor 是 否 已 被 锁定 。 

O 4698 2: 如 果 monitor 没有 锁定 ， 锁 住 它 然后 返回 。 

O 步骤 3: 如 果 monitor 已 经 锁定 ， 检 查 它 是 否 被 本 线程 锁定 。 如 果 是 的 话 ， 递 增 重复 锁定 
数字 并 返回 。 

O 469% 4: 如 果 monitor 由 其 他 线程 锁定 ， 等 待 以 后 再 次 锁定 它 。 

monitorenter 的 伪 代 码 可 以 像 下 面 这 样 实现 。 


void STDCALL vm_object_lock(Object* jmon) 
{ 
Locked_obj* plock = null; 
Locked_obj* head = thread_get_locked_obj_list(); 
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// 试图 非 阻塞 锁定 这 个 对 象 
// 测试 并 设置 对 象 的 LOCK_BIT 
bool result = lock_non_blocking(jmon) ; 
if( !result ){ 
// 对 象 已 被 锁定 
// 查询 当前 线程 的 locked_obj_list 
plock = lookup_in_locked_obj_list (head, jmon); 
if( plock->jobject == jmon) { 
// 由 本 线程 锁定 ， 增 加 进入 次 数 
plock->recursion++; 
return; 
selse{ 
// 由 其 他 线程 锁定 ， 在 monitor 上 休眠 
jmon = lock_blocking(jmon) ; 
// 当 它 从 休眠 中 醒 来 的 时 候 ， 持 有 锁 
// 重新 加 载 jmon， 以 防 被 GC 移动 过 
} 
} 
// 当前 线程 第 一 次 持 有 锁 
// 在 它 的 locked_obj_list 中 记录 这 个 对 象 
plock = (Locked_obj*)vm_alloc (sizeof (Locked obj)); 
plock->jobject = jmon; 
plock->recursion = 0; 
plock->next = head; 
thread_insert_locked_obj_list (plock); 





return; 


} 

lock_non_blocking () 的 概念 代码 如 下 所 示 。 它 不 会 阻塞 线程 ， 而 会 返回 锁定 操作 的 成 功 
或 失败 的 结果 。 注 意 ， 因为 没有 保证 所 需 的 原子 操作 。 当 多 个 线程 竞 
争 锁定 的 时 候 , 结果 也 许 是 无 法 预料 的 。 例 如 ,有 可 能 每 个 线程 都 确信 自己 获得 了 锁 。 后 面 会 介 
绍 如 何 用 原子 指令 正确 实现 它 


bool lock_non_blocking(Object* jmon) 


{ 
// 假定 Object 关于 锁定 状态 的 元 数据 位 于 对 象 头 中 
uint32* pheader = (uint32*)object_header_addr (jmon) ; 
urtnt32 lock_bit_mask = 1 << LOCK_BIT; 
{ // 下 面 的 操作 应 该 是 原子 化 的 ， 比 如 
// compare-exchange (或 test-swap、test-set) 
// 后 面 会 讨论 这 一 点 
uint32 orig bit val = (*pheader) & lock bit mask 
*pheader |= lock bit mask; 
} 
return !orig_bit_val; 


} 
lock_non_blocking () MiiPeVEdE 1ock_release() ， 它 清除 对 象 头 中 的 LocK_BIT， 表 
示 未 锁 状 态 。 央 为 只 有 锁 的 拥有 者 可 以 释放 这 个 锁 ， 所 以 它 不 需要 原子 化 操作 


void lock_release(Object* jmon) 
{ 
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uint32* pheader = (uint32*) object_header_addr(jmon) ; 
uint32 lock bit mask = 1 <x LOCK BIT; 
*pheader &= ~lock_bit_mask; 

} 


下 面 给 出 lock_blocking () 的 伪 代 码 。 


Object* lock_blocking(Object* jmon) 
{ 
VM_Thread* self = thread_self(); 
// 试图 获得 锁 
while( !lock_non_blocking(jmon) ) { 
// 无 法 获得 锁 ， 进入 休眠 
// 记录 被 阻塞 的 锁 
self->blocked_lock = jmon; 
self->status = THREAD_STATE_ MONITOR; 
// 休眠 等 待 唤醒 
wait_for_signal( self->SIG_UNLOCK, 0); 
// 被 解锁 这 个 monitor 的 线程 唤醒 
self->status = THREAD_ STATE_RUNNING; 
// 重新 加 载 对 象 ， 以 防 被 GC 移动 过 
jmon = self->blocked_lock; 
self->blocked_lock = null; 
// 循环 回去 再 次 竞争 锁 





} 
// 终于 获得 锁 ， 然 后 返回 
return jmon; 


} 


当 锁 不 可 得 的 时 候 ， 线 程 就 在 一 个 事件 self->sIG_UNLOCK 上 等 待 。 当 它 从 等 待 中 被 唤醒 
之 后 ， 线 程 循环 回去 ， 再 次 锁定 这 个 monitor。 线 程 锁定 这 个 monitor Za, KOR E 


6.5.4 monitorexit 
monitorexit Æ monitorenter 的 反 向 操作 。 它 的 操作 语义 如 下 。 


口 步骤 1: 检查 锁 是 否 由 自身 持 有 。 

O ASR 2: 如 果 不 是 由 自身 锁定 ， 抛 出 一 个 异常 指示 IllegalMonitorstate， 然 后 返回 。 
O 步 又 3: 如 果 由 自身 锁定 ， 检 查 重 复 次 数 ， 如 果 重 复 次 数 大 于 零 ， 递 减 它 然后 返回 。 

口 步骤 4: 如 果 重 复 为 零 ， 释 放 锁 。 

O 步骤 S: 检查 是 否 有 任何 线程 阻塞 等 待 锁定 这 个 对 象 。 如 果 没 有 等 待 线程 就 返回 。 如 果 有 
等 待 线程 ， 唤 醒 它 然后 返回 。 


下 面 给 出 monitorexit 的 伪 代 码 。 


void STDCALL vm_object_unlock(Object* jmon) 
{ 





// 检查 jmon 是 否 为 锁定 对 象 

Locked_obj* plock = null; 

Locked_obj* head = thread_get_locked_obj_list(); 
plock = lookup_in_locked_obj_list (head, jmon) ; 
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ift Ipheck ) 4 
// 锁 不 由 当前 线程 持 有 
vm_throw_exception("IllegalMonitorState"); 

} 

// 锁 由 当前 线程 持 有 

plock->recursion--; 

if (plock->recursion == -1) { 
// 不 再 持 有 这 个 锁 ， 释 放 锁 记录 
plock->jobject = null; 
delete_from_locked_obj_list (head, jmon) ; 
// 清除 对 象 头 中 的 LOCK_BIT 
// 与 lock_non_blocking() 对 应 
lock_release (jmon); 
// 与 lock_blocking() 对 应 
notify_blocking_threads (jmon); 

} 

return; 


} 


只 有 锁定 线程 可 以 解锁 monitor。 因 此 ,解锁 函数 实现 起 来 很 直观 ， 不 需要 担心 竞 态 条 件 。 
— FL monitor 解锁 之 后 ， 当 前 解锁 线程 需要 唤醒 阻塞 等 待 锁定 这 个 monitor 的 线程 。 没 有 规定 要 
唤醒 多 少 个 线程 。 不 管 唤醒 多 少 个 线程 , 其 中 只 有 一 个 能 够 在 竞争 中 赢得 这 个 锁 。 所 以 只 唤醒 一 
个 线程 也 是 可 以 的 。notify_blocking_threads () 的 伪 代 码 如 下 所 示 。 


void notify_blocking_threads (Object* jmon) 
{ 
VM _ Thread* kthread = vm_thread_list(); 
// SRR BALI RAR AS K R4 


for ( ; kthread != null; kthread = kthread->next) { 
Object* blocked_lock = kthread->blocked_lock; 
if( blocked_lock == jmon ) { 


// 唤醒 这 个 线程 
deliver signal (kthread->SIG UNLOCK); 
return; 
} 
} 
return; 


} 

在 monitor 锁定 和 解锁 实现 中 ， 代 码 利 用 OS 支持 来 等 待 和 发 送信 号 。 每 个 线程 用 两 个 信和 号 
(或 事件 ) 与 其 他 线程 及 OS 内 核 交 流 。 在 Windows 系统 中 ， 这 些 信号 可 以 实现 为 Event 对 象 。 
在 Linux 系统 中 ， 这 些 信号 可 以 用 条 件 变量 实现 。 它 们 不 应 该 与 Java 方法 Object .wait () 和 
Object .notify() 混 消 。 可 以 把 它们 看 作 实现 于 不 同 层级 的 类 似 构 件 。 

这 并 不 意外 ， 因 为 monitor 是 一 个 常用 基本 线程 同步 构件 。 当 前 OS 的 设计 或 者 直接 支持 
monitor， 或 者 支持 其 他 很 容易 实现 monitor 语义 的 构件 。 换 句 话 说 ， 其 他 系统 的 同步 构件 也 可 以 
构造 在 JVM monitor 之 上 ， 尽 管 不 一 定 能 够 获得 很 好 的 性 能 和 可 扩展 性 。 
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6.5.5 Object.wait() 


有 了 前 面 实现 的 monitorenter 和 monitorexit， 可 以 用 类 似 方法 实现 对 象 的 wait () 和 
notify()。 唯 一 值得 指出 的 一 点 是 , 在 wait () 中 解锁 monitor 之前， 当前 线程 应 该 记录 锁 重 复 
次 数 ， 这 样 当 它 再 次 获得 锁 的 时 候 ， 可 以 恢复 重复 次 数 。 

void object_wait (Object* jmon, unsigned int ms) 

; // 检查 jmon 是 否 为 锁定 对 象 

Locked_obj* plock = null; 


Locked_obj* head = thread_get_locked_obj_list(); 
plock = lookup_in_locked_obj_list (head, jmon) y 


ift Iplock f} ¢ 
vm_throw_exception("IllegalMonitorState") ; 
return; 


} 


// 在 当前 线程 中 记录 jmon 

VM Thread* self = thread_self(); 
self->waited_condition = jmon; 
self->status= THREAD_STATE_WAIT; 

// 在 等 待 之 前 释放 锁 ， 记 录 锁 定 次 数 

int temp_recursion = plock->recursion; 
plock->recursion = 0; 
vm_object_unlock(jmon) ; 


bool signaled = wait_for_signal(self->SIG_ NOTIFY, ms); 
// BR 

self->status= THREAD STATE RUNNING; 
self->waited_condition = null; 

// BREBR, HAZ locked_obj_list 
vm_object_lock(jmon) ; 

// 恢复 锁定 重复 次 数 

head = thread_get_locked_obj_list(); 

// 找到 节点 

plock = lookup_in_locked_obj_list (head, jmon) ; 
plock->recursion = temp_recursion; 








if (self->interrupted) 
self->interrupted 
vm_throw_exception 


false; 
"Interrupted" jy 


= ila 


6.5.66 Object.notify() 


对 象 的 notify () 与 notify_blocking_threads (jmon) 非常 相似 , KR 了 它 会 向 等 待 
SIG_NOTIFY ( 而 不 是 SIG_UNLOCK ) 的 (一 个 或 多 个 ) 线程 发 送 一 个 信号。 
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void object_notify(Object* jmon) 


{ 
// 检查 jmon 是 否 为 锁定 对 象 
Locked_obj* plock = null; 
Locked_obj* head = thread_get_locked_obj_list(); 
plock = lookup_in_locked_obj_list (head, jmon) ; 
tft Iplock } £ 
vm_throw_exception("IllegalMonitorState") ; 
return; 
} 
VM_Thread* kthread = vm_thread_list(); 
// 选 代 线 程 列表 找到 阻塞 线程 
for ( ; kthread != null; kthread = kthread->next) { 
Object* waited_cond = kthread->waited_condition; 
if (waited_cond == jmon ){ 
// 唤醒 这 个 线程 
deliver signal(kthread->SIG NOTIFY); 
return; 
} 
} 
return; 
} 


图 6-3 展示 了 线程 操作 monitor 的 状态 转换 图 。 工 业界 和 学 术 界 做 了 大 量 工作 来 探索 对 
monitor 实现 的 优化 ， 例 如 元 锁 ( meta-lock )、 瘦 锁 ( thin-lock )， 等 等 。 第 18 章 将 介绍 其 中 一 些 
技术 。 





等 待 SI@_ NOTIFY 
‘THREAD. STATE WAIT: 










等 待 STG_UNLOCK “一 
THREAD. STATE MONITOR 





图 6-3 在 monitor 上 操作 时 的 线程 状态 转换 


6.6 RF B 








6.6 原子 


JVM monitor 是 一 个 阻塞 操作 。 这 意味 着 如 果 线 程 无 法 获得 锁 就 会 阻塞 休眠 。 应 用 程序 ( 不 
是 VM ) 无 法 试图 获得 锁 而 不 被 阻塞。 有 时 候 ， 一 个 线程 可 能 只 想 知 道 自 己 能 和 否 获得 锁 ， 或 者 锁 
是 否 已 经 被 别人 拿 到 。 然 后 这 个 线程 才能 决定 下 一 步 怎么 做 ， 是 阻塞 、 重 试 ， 还 是 放弃 。 

例如 ， 在 并 行 图 遍历 算法 中 ， 多 个 线程 试图 用 标签 VISITED 标记 图 节点 。 节 点 的 初始 状态 
为 NULL。 如 果 节 点 已 经 是 VISITED 状态 ， 就 不 需要 任何 操作 。 当 线程 到 达 一 个 节点 的 时 候 ， 基 
本 上 会 执行 以 下 操作 : 

if (flag == NULL ){ 


flag == VISITED; 
} 


如 果 一 个 节点 已 经 被 访问 过 ， 当 前 线程 就 会 放弃 它 ， 并 继续 访问 图 中 下 一 个 节点 。 如 果 其 他 
线程 正在 访问 同一 个 节点 , 这 个 线程 既 不 希望 被 阻塞 进入 休眠 ,也 不 希望 休眠 以 等 待 标志 再 次 恢 
复 为 NULL， 所 以 下 面 的 JVM monitor 代码 不 会 按照 期 望 那样 工作 。 


synchronized( Node ) { 
IEL flag == NUL ){ 
flag == VISITED; 





} 
} 


在 上 面 的 代码 中 ， 如 果 另 外 一 个 线程 已 经 锁定 了 Node 对 象 的 monitor， 那 么 当前 线程 不 能 
继续 ， 而 是 阻塞 等 待 这 个 monitor 解锁 。 这 样 做 是 多 余 的 ， 因 为 当前 线程 应 该 继续 操作 下 一 个 节 
点 。 对 这 个 标志 的 这 些 操作 ， 是 常见 的 对 一 个 内 存 值 的 test&set ( 测试 并 设置 ) 操作 序列 。 如 果 
可 以 原子 化 执行 这 个 序列 ， 就 不 需要 涉及 monitor。 这 里 需要 的 是 下 面 的 概念 模型 。 


atomic{ 
if(flag == NULL: Yi 
flag == VISITED; 
} 
} 


出 于 这 个 目的 ，Java 引 入 了 原子 变量 ， 原 子 变 量 可 以 对 test&set 这 样 的 几 个 基本 操作 进行 原 
子 化 操作 。 我 们 可 以 用 原子 变量 实现 图 遍历 。 


AtomicInteger flag = new AtomicInteger (NULL) ; 
flag.compareAndSet (NULL, VISITED) ; 


这 个 操作 的 效率 取决 于 VM 中 原子 变量 的 实现 。 

所 有 现代 微 处 理 吾 都 有 像 test&set 这 样 用 于 简单 内 存 操 作 的 原子 指令 。 在 X86 CPU 中 , 可 以 
用 带 前 级 lock 的 指令 确保 指令 原子 化 。 例 如 ， 下面 的 内 联 汇编 代码 实现 了 对 内 存 中 一 个 字 的 原 
子 化 比较 与 交换 。 它 就 是 在 非 原 子 指令 cmpxchg 之 前 加 上 了 前 级 lock。 这 个 指令 将 内 存 
address 中 的 值 与 cmperand 比较 ， 如果 相等 ,就 把 值 exchange 保存 在 address 中 ; 否则 就 
不 会 存储 。 这 两 种 情况 下 都 会 返回 内 存 address 中 原来 的 值 。 
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inline int AtomicCompareExchange(int *address, 
int comperand, 
int exchange) 


{ 
#ifdef __LINUX__ 


__asm_ ( 
"lock \tcempxchg %1, (%2)\t\n" 
:"=eax" (comperand) 


: "edx" (exchange), "r"(address), "eax"(comperand) ); 


#else 

#ifdef _ WINDOWS__ 
asm { 
mov eax, comperand 
mov edx, exchange 
mov ecx, address 
lock cmpxchg [ecx], edx 
mov comperand, eax 
} 

#endif 

#endif 

} 


当 处 理 器 执行 带 Lock 前 组 的 指令 时 , 一 种 实现 是 处 理 器 断言 内 存 总 线 以 获得 对 内 存 的 独占 
访问 。 其 他 处 理 器 的 内 存 操作 就 会 被 阻塞 等 待 总 线 断 言 (assertion ) 解除 。 
VM 可 以 用 AtomiccompareExchange 在 如 下 伪 代 码 中 实现 原子 变量 的 compareandset 
BE. 
boolean compareAndSet (int* this, int comp, int set) 
{ 
int original; 
original = AtomicCompareExchange(this, comp, set) 


if( original == comp) 
return true; 


return false; 


} 


有 些 处 理 器 有 对 多 指令 临界 区 的 硬件 锁 支 持 。 支 持 硬件 多 线程 的 处 理 器 通常 会 提供 这 个 功 
能 。 原 子 也 可 以 用 这 个 功能 实现 。 


在 不 使 用 基于 总 线 内 存 子 系统 的 多 核 计算 机 中 , 或 者 在 分 布 式 共享 内 存 计 算 机 系统 中 , 内存 
访问 互 斥 的 开销 要 比 在 基于 总 线 的 系统 中 大 得 多 。 原 子 化 的 实现 方法 可 能 会 完全 不 同 。 


在 单 核 系统 中 , 通常 处 理 器 自然 而 然 就 支持 了 指令 级 原子 化 。 即 使 指令 可 能 在 流水 线 中 乱 序 
执行 ,处 理 融 呈现 给 开发 者 的 结果 必须 与 按照 指令 序列 顺序 执行 代码 的 结果 一 样 。 所 以 在 单 处 理 
器 系统 中 , 不 需要 总 线 断 言 。 例如， 可 以 在 AtomicCompareExchange 的 实现 中 省 去 前 级 lock 
以 降低 处 理 器 开销 。 
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6.7 monitor 与 原子 


原子 化 帮助 避免 了 阻塞 同步 ， 阻 塞 同步 被 认为 是 monitor 的 缺点 。 所 以 原子 化 有 时 候 也 称 为 
非 阻 塞 同 步 。 但 本 质 上 来 说 ， 原 子 化 和 monitor 是 一 样 的 ， 唯 一 的 区 别 在 于 锁 的 粒度 。 


6.7.1 阻塞 与 非 阻塞 


使 用 monitor, 互 斥 可 以 通过 检查 内 存 中 的 共享 数据 实现 , 等 待 可 以 在 OS 层级 通过 线程 调度 
实现 。 使 用 原子 指令 ,， 互 斥 可 以 通过 处 理 器 断言 内 存 总 线 实现 ， 等待 可 以 在 处 理 器 层级 通过 指令 
流水 线 调度 实现 。 其 他 内 存 指令 保存 在 一 个 队列 中 ,直到 内 存 断 言 解 除 才 能 进入 流水 线 。 总 线 断 
言 只 用 于 带 有 lock 前 绥 的 单个 指令 ,因此 对 其 他 内 存 操作 的 阻塞 时 间 非 常 得， 例如 几 个 周期 到 
几 百 个 周期 。 

与 之 相 比 ， 通 过 线程 调度 实现 的 monitor 的 等 待 时 间 由 锁定 临界 区 的 持续 时 间 和 OS 调度 效 
率 决定 。 其 完成 时 间 无 法 确保 。 如 果 开 发 者 在 临界 区 中 只 放 入 很 短 的 代码 序列 ， 那么 等 待 时 间 可 
以 像 调度 时 间 片 那么 短 ， 其 至 还 能 更 短 。 

对 于 互 斥 来 说 ,总 是 会 发 生 阻 塞 , 并 且 在 不 同 的 层次 上 以 不 同 的 粒度 阻塞 。 原子 可 以 被 看 作 
指令 级 的 指令 粒度 原子 化 , 而 monitor 可 以 被 看 作 OS 级 的 时 间 片 粒度 原子 化 。 当 我 们 在 OS 级 上 
讨论 的 时 候 ， 说 原子 是 非 阻塞 的 ， 这 是 没有 问题 的 ， 也 就 是 不 涉及 OS 调度 。 如 果 一 个 算法 只 使 
用 原子 ， 就 可 以 被 看 作 非 阻塞 的 ， 因 为 线程 永远 不 会 阻塞 休眠 。 


6.7.2 PRHA 


不 管 原子 化 的 粒度 如 何 , 要 实现 互 斥 ,关键 是 要 找到 所 有 参与 线程 都 必须 经 过 的 中 央 控 制 点 。 
对 原子 指令 来 说 ,中 央 控 制 点 就 是 总 线 ， 因 为 计算 机 中 所 有 的 内 存 操作 都 要 经 过 它 [ 这 里 只 讨论 
共享 内 存 多 处 理 器 ( SMP )， 但 对 于 非 SMP 来 说 ， 这 个 概念 仍然 是 成 立 的 ]。 因 此 ， 所 有 的 原子 
指令 ,不 管 是 否 操作 同样 的 内 存 地 址 ， 都 是 彼此 互 斥 的 。 

对 于 monitor 同步 来 说 ， 中 央 控 制 点 是 monitor 对 象 。 因 此 ， 锁 住 的 monitor 只 会 阻塞 想 要 锁 
住 同 一 个 对 象 的 线程 ， 而 不 会 影响 其 他 线程 。 如 果 所 有 的 线程 都 使 用 同一 个 monitor， 那 么 它 就 
成 了 一 个 大 全 局 锁 。 


6.7.3” 锁 与 非 锁 

要 确定 一 个 临界 区 是 否 需要 锁 , 我 们 需要 检查 这 个 临界 区 的 运行 实例 是 交替 执行 还 是 同时 并 
发 执行 。 

来 自 于 同一 个 处 理 器 的 指令 总 是 按 序 完 成 提交 ， 所 以 从 程序 的 角度 来 说 ， 它 们 不 会 相互 交 春 。 
每 条 指令 〈 作为 一 个 细 粒 度 的 临界 区 ) 可 以 被 认为 是 原子 的 ，1ock 前 级 可 以 省 略 。 如 果 是 多 核 
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的 情况 ， 所 有 核 都 可 以 同时 向 总 线 发 起 内 存 操作 。 来 自 不 同 核 的 指令 可 能 交替 访问 总 线 ， 要 得 到 
原子 化 保证 就 要 添加 Lock 前 级 。 

作为 对 比 ， 如 果 临 界 区 是 不 同 线程 中 的 代码 段 , 线程 在 同一 个 处 理 疑 上， 那么 它们 的 执行 可 
能 交替 。 或 者 线程 在 不 同 的 处 理 器 上 ,那么 临界 区 可 能 并 发 运行 。 因 此 ， 这 里 要 实现 互 斥 ， 就 不 
能 省 略 monitor 锁 。 

但 是 ， 特 殊 情 况 下 monitor 也 可 能 省 略 它 的 锁 。 例 如 ， 如 果 应 用 程序 只 有 一 个 线程 ， 那 么 所 
有 的 锁 都 可 以 被 省 略 。 


甚至 多 线程 下 也 可 以 省 略 锁 。 如 果 用 户 级 线程 库 中 所 有 线程 共享 同一 个 本 地 线程 上 下 文 , 那 
么 省 略 锁 也 是 可 能 的 。 首 先 , 使 用 同一 个 本 地 线程 上 下 文 , 临界 区 的 并 发 执行 是 不 可 能 的 。 其 次 ， 
如 果 代码 满足 以 下 两 个 条 件 ， 交 替 执行 也 是 可 以 避免 的 。 


O 线程 库 不 会 抢占 式 调 度 线程 ， 而 是 只 在 线程 自愿 让 行 的 时 候 才 切换 上 下 文 。 
口 所 有 用 户 线程 只 在 临界 区 之 外 的 代码 区 域 让 行 。 


有 些 系统 利用 了 这 个 性 质 。 


6.7.4” 非 阻塞 之 上 的 阻塞 


由 于 monitor 和 原子 的 关系 ， 多 数 monitor 用 原子 来 实现 。 换 名 话说， 阻塞 锁 通 常用 非 阻塞 
锁 加 上 等 待 来 实现 ， 如 以 下 概念 代码 所 示 。 


void lock_blocking(Object* jmon) 
{ 
retry: 
ok = lock_non_blocking(jmon) ; 
if( ok ) return; 
wait_on_lock(jmon) ; 
goto retry; 


} 


在 以 上 锁定 monitor 的 例子 中 ， 核 心 操 作 是 lock_non_blocking(jmon) ， 它 使 用 原子 
test&set 来 获得 这 个 锁 。 前 面 已 经 介绍 过 ， 我 们 在 对 象 头 中 用 位 LOCK_BIT 指示 对 象 是 否 已 经 锁 
定 。 所 以 lock_rion_blocking (jmon) 的 伪 代 码 如 下 。 


bool lock_non_blocking (Object* jmon) { 

{ 
volatile int* pheader = jmon->header; 
int orig = p; 


#ifdef _ LINUX__ 
__asm__ __volatile__ ( 
"lock btsl %2,%1\n\t" 
"sbbl %0,%0" 
:"=r" (orig),"=m" (*pheader) :"Ir" (LOCK_BIT) : “memory”); 
#else 
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#ifdef _ WINDOWS __ 
__asm{ 
mov eax, pheader 
mov edx, LOCK_BIT 
xor ecx, ecx 
lock bts dword ptr [eax], edx 
sbb ecx, ecx 
mov orig, ecx 
} 
#endif 
#endif 
return (bool) torig; 
} 


在 这 段 示 例 代码 中 , 指令 bts 使 用 了 lock WR, 它 会 原子 化 地 把 指定 内 存 的 指定 位 与 1 交 
换 。 这 一 位 原来 的 值 保存 在 处 理 咒 的 CF (carry flag， 进 位 标志 ) Po cr {A 1 表示 锁 由 其 他 线程 
持 有 ， 值 0 表示 当前 线程 成 功 锁定 了 它 


这 个 模式 类 似 于 cmpxchg 指令 ， 区别 在 于 bts 不 把 原来 的 值 保 存在 一 个 寄存 器 中 。 然 后 代 
码 用 sbb 指令 把 cr 中 的 值 转换 到 寄存 器 中 。spb 指令 把 源 操 作 数 与 cr 相 加 ， 然 后 在 目标 操作 
数 中 减 去 这 个 相 加 的 结果 。 这 个 相 减 的 结果 保存 在 目标 操作 数 中 。 由 于 源 操 作 数 和 目标 操作 数 都 
是 0， 如 果 cr 值 为 0， 那 么 目标 操作 数 中 的 结果 仍 是 0。 如 果 cr 为 1， 那么 结果 就 是 -1 ( 即 非 
FW) KA cr 的 值 与 期 望 的 布尔 结果 相反 ， 所 以 这 段 代码 返回 了 cr 值 的 否 。 


原子 不 能 代替 monitor， 因 为 有 时 候 如 果 等 待 时 间 长 度 不 定 的 话 ， 那 么 阻塞 还 是 需要 的 。 在 
多 线程 应 用 程序 的 开发 中 ，monitor 和 原子 的 作用 通常 是 互补 的 。 


6.8 ”回收 器 与 修改 器 


应 用 程序 在 VM 中 运行 的 时 候 , 通常 存在 几 类 线程 。 主 要 的 一 类 是 应 用 程序 线程 。 从 内 存 管 
理 的 角度 看 ， 应 用 程序 线程 也 称 为 修改 器 ， 因 为 它 改变 内 存 。 用 于 垃圾 回收 的 线程 叫 作 回收 器 。 
根据 YM 设计 的 不 同 ， 垃 圾 回收 可 以 在 修改 器 线程 的 上 下 文中 执行 ， 也 可 以 在 专用 线程 中 执行 。 

使 用 停止 世界 ( stop-the-world ) GC， 修 改 器 被 垃圾 回收 暂停 ， 然 后 可 以 在 被 暂停 的 修改 器 
的 上 下 文中 完成 回收 。 在 这 种 设计 中 ， 回 收 器 和 修改 器 是 同一 个 本 地 线程 的 不 同 阶段 。 

使 用 专门 线程 用 于 垃圾 回收 也 是 很 常见 的 , 其 中 修改 器 和 回收 占 由 不 同 的 本 地 线程 支持 。 在 
停止 世界 GC 中 ， 回 收 需 在 回收 进行 时 恢复 执行 ， 并 在 回收 完成 后 休眠 。 在 并 发 式 GC 中 ， 修 改 
fit ALE] WAC AIP ACI AF o 

在 JVM "F (Be i W MM Thread. start () 启 动 并 需要 绑 定 到 Java 线程 对 象 的 Java 线程 。 
回收 器 不 是 Java 线程 。 RD 以 减少 创建 新 线程 的 开销 。 

除了 修改 器 和 回收 器 ， 即 时 (JIT) 编译 也 可 以 在 专用 线程 中 执行 。 举 个 例子 ，JIT 编译 器 编 

一 个 方法 的 时 候 ， 如 果 它 发 现 当前 方法 会 调用 几 个 还 没有 编译 的 方法 ,那么 在 多 核 系统 中 , € 
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可 以 把 它们 传递 给 另 一 个 专用 JIT 线程 来 并 发 编译 。 这 样 ， 通 过 把 方法 编译 移出 关键 路 径 ， 也 许 
可 以 减少 应 用 程序 的 执行 时 间 。 

在 JVM 中 ,通常 有 专门 的 线程 用 于 终结 (finalization ) 和 弱 引 用 处 理 。JVM 规范 没有 指定 
终结 死亡 对 象 的 时 间 要 求 , 也 没有 指定 弱 引 用 对 象 人 队 的 时 间 要 求 。 用 专门 线程 在 任何 关键 路 径 
之 外 分 别处 理 它们 是 很 方便 的 。 这 些 线程 一 定 是 Java 线程 ， 因 为 它们 在 执行 Java 方 法。 考虑 到 
这 一 点 ， 应 该 把 它们 也 当 作 修改 器 。 第 12 章 会 进一步 讨论 这 个 主题 。 

在 Apache Harmony 中 ， 修 改 器 和 回收 器 都 是 分 配器 (allocator ) 线程 的 子 类 。 分 配器 负责 从 
堆 上 分 配 内存 。 修 改 器 在 应 用 程序 执行 过 程 中 会 从 堆 上 分 配对 象 。 回 收 器 在 把 活跃 对 象 从 一 处 移 
动 到 另 一 处 的 时 候 会 从 堆 上 分 配对 象 。 以 下 代码 是 allocator 的 简化 定义 。 


struct Allocator{ 


void *free; // 分 配 起 始 地 址 
void *ceiling; // SBC ERR (KER) 
void* end; // 分 配 块 边界 


Block *alloc_block; // 线程 局 部 分 配 块 

Space* alloc_space; // 全 局 块 分 配 空 间 

Ge *gC; // gc 算法 

VM_Thread *thread; // 分 配器 的 线程 
} 


Allocator 维护 了 一 个 线程 局 部 块 (alloc_block )， 这 样 内 存 分 配 动作 就 可 以 无 须 互 斥 。 
在 Windows 系统 中 ， 当 前 线程 的 Allocator 数据 结构 的 地 址 保存 在 线程 局 部 存储 (TLS ) 中 ; 
在 Linux 系统 中 ， 则 保存 在 线程 专用 数据 (TSD) 中 。 因 此 ， 每 个 线程 ( 修改 器 或 者 回收 费 ) 都 
能 快速 找到 它 的 Allocator 数据 用 于 对 象 分 配 。 


6.9 线程 局 部 数据 


线程 局 部 数据 是 指 那些 由 一 个 线程 单独 拥有 的 数据 。 这些 数据 只 能 由 这 个 线程 访问 。 对 开发 
者 来 说 , 线程 局 部 数据 是 很 有 吸引 力 的 ， 因为 “线程 局 部 ”这 个 性 质 可 以 应 用 于 多 个 方面 。 最 显 
而 易 见 的 性 质 就 是 对 线程 局 部 数据 的 访问 不 需要 锁 来 实现 互 斥 。 线 程 局 部 数据 基本 上 可 分 为 3 
种 : 寄存 带 文 件 、 运 行 时 栈 和 线程 局 部 堆 。 


前 文 已 经 介绍 过 ,基本 上 线程 上 下 文 由 程序 计数 融和 栈 指针 组 成 。 它 们 是 持 有 线程 私有 , 或 
者 唯一 标识 这 个 线程 的 数据 的 寄存 器 。 现 实 中 , 线程 上 下 文 可 能 包含 所 有 的 寄存 器 ， 有 时 称 为 寄 
存 天 文件 。 

线程 上 下 文 可 能 由 多 个 线程 复 用 , 但 是 当 一 个 线程 在 执行 的 时 候 , 通常 它 不 能 访问 其 他 线程 
的 上 下 文 。 不 过 有 一 些 例外 。 例 如 ， 当 一 个 线程 暂停 或 调试 另 一 个 线程 的 时 候 ， 有 一 些 OS 允许 
这 个 线程 访问 被 暂停 或 被 调试 的 线程 的 上 下 文 。 有 一 些 处 理 器 提供 了 路 线程 共享 的 全 局 寄存 融 。 
这 些 例 外 是 已 知 的 特殊 情况 ， 不 会 影响 这 里 对 线程 局 部 的 讨论 。 

运行 时 栈 是 线程 的 运行 时 临时 数据 , 它 也 是 线程 局 部 的 。 由 于 栈 通常 分 配 在 系统 内 存 中 ， 如 
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果 把 栈 指针 传递 给 其 他 线程 的 话 , 那么 它 也 是 可 以 被 其 他 线程 访问 的 。 和 寄存 器 类 似 ， 运行 时 栈 
的 跨 线程 访问 是 严格 控制 的 特殊 情况 ， 不 改变 通常 情况 下 的 线程 局 部 特性 。 
ALTE ait CUE AIS FT AT RR AIVE OS 支持 的 线程 局 部 数据 ， 默认 情况 下 应 用 程序 不 需要 做 额外 工 
作 ， 就 可 以 假定 它们 的 线程 局 部 特性 。 也 就 是 说 ， 如 果 把 一 个 变量 放 到 寄存 器 中 或 者 放 到 线程 栈 
上 ， 那 么 它 不 会 被 其 他 线程 访问 。 
线程 局 部 堆 不 同 于 寄存 器 或 者 栈 。 它 不 是 由 OS 设计 所 支持 的 , 而 是 由 应 用 程序 惯例 所 支持 。 
默认 情况 下 堆 是 由 所 有 线程 共享 的 。 如 果 一 个 堆 区 域 对 一 个 线程 是 局 部 的 , 意味 着 下 面 两 种 情况 
ss 
口 第 一 种 情况 下 ， 这 个 区 域 是 其 他 线程 不 能 访问 的 。 这 个 区 域 可 能 被 虚拟 内 存 机 制 或 者 任 
何 实施 这 个 惯例 的 技术 所 保护 ， 或 者 简单 来 说 就 是 一 个 所 有 线程 都 遵守 的 规则 。 例 如 ， 
线程 局 部 块 由 一 个 线程 持 有 ， 用 于 对 象 分 配 。 这 个 块 只 在 对 象 分 配 的 意义 上 对 线程 是 局 
部 的 。 一 旦 对 象 被 分 配 了 ， 它 就 可 以 被 所 有 线程 访问 。 
口 第 二 种 情况 下 ， 这 个 区 域 并 不 是 设计 为 线程 局 部 的 ， 而 是 事实 上 只 有 一 个 线程 会 实际 访 
问 它 。 这 种 数据 被 称 为 “ 非 逃 逸 ” (nonescape ) 的 ， 也 就 是 说 ， 它 们 被 局 限 在 这 个 线程 
的 范围 之 内 。 一 旦 数据 被 其 他 线程 访问 ， 它 就 “逃离 ”了 当前 线程 。“ 和 逃逸 分 析 ” 是 一 
个 重要 的 编译 器 技术 ， 它 试图 找到 “ 非 逃 逸 ”数据 并 把 它们 作为 线程 局 部 数据 来 优化 。 
线程 局 部 堆 可 能 是 临时 的 。 它 可 以 在 一 段 时 期 内 是 线程 局 部 的 。 在 这 段 时 间 之 后 , 它 可 能 是 
其 他 线程 可 以 访问 的 ， 或 者 可 能 被 传递 给 第 二 个 线程 作为 线程 局 部 的 。 
有 时 候 , 线程 可 能 想 要 通过 同一 个 变量 名 (或 同一 个 API ) 访问 各 自 的 线程 局 部 堆 。 比 较 好 的 
做 法 是 ， 不 同 线程 访问 变量 my_region (或 者 APImy_region() ) 的 时 候 ， 返 回调 用 线程 自己 的 
线程 局 部 堆 。 也 就 是 说 , 不 同 的 调用 线程 有 不 同 的 线程 局 部 堆 , 但 是 共享 同一 个 名 字 。 这 个 功能 称 
为 “线程 局 部 存储 ”( thread-local storage, TLS ) 或 “线程 专用 数据 ”( thread-specific data, TSD ). 
这 个 功能 可 以 构建 在 OS 支持 的 线程 局 部 数据 之 上 。 例 如 ， 每 个 线程 把 它 的 线程 局 部 堆 的 地 
址 放 在 同一 个 寄存 器 中 。 然 后 所 有 线程 可 以 通过 访问 这 个 同名 寄存 器 来 访问 各 自 的 线程 局 部 堆 。 
尽管 寄存 器 名 是 相同 的 , 但 是 寄存 器 内 容 来 自 于 不 同 的 线程 上 下 文 。 另 外 一 个 解决 方案 是 把 线程 
局 部 堆 地 址 放 到 各 自 运行 时 栈 的 同一 个 槽 位 中 。 不同 的 线程 可 以 在 栈 中 使 用 同样 的 槽 位 号 来 提取 
各 自 的 线程 局 部 堆 地 址 。 


线程 局 部 分 配器 


在 Apache Harmony 中 ， 每 个 线程 为 线程 局 部 数据 分 配 一 个 堆 区 域 。 这 个 区 域 的 地 址 保存 在 
一 个 TLS 变量 中 ， 可 以 使 用 API vm_thread_local () 访问: 


void* tls_base = vm_thread_local(); 


在 这 个 线程 局 部 区 域 之 内 ,Allocator 数据 结构 的 地 址 保存 在 一 个 固定 的 位 置 。 也 就 是 说 ， 
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从 这 个 区 域 起 点 的 偏 移 量 是 一 个 常量 ， 这 个 常量 保存 在 全 局 变量 tls_alloc_offset 中 。 使 用 
这 种 设计 ， 我 们 可 以 通过 下 面 的 代码 序列 访问 这 个 分 配器 。 


extern int tls_alloc_offset; 
inline Allocator* thread_get_allocator () 
{ 
void* tls_base = vm_thread_local(); 
char* tls_slot = (char*)tls_base + tls_alloc_offset; 
int* allocator = *(int*)tls_slot; 
return (Allocator*) allocator; 


} 


SR Jew AT DA FM By A SBE His FT ao 


// 这 个 例 程 不 处 理 任何 慢 路 径 操 作 
// 而 是 如 果 不 成 功 就 返回 null 
Object* gc_alloc_fast (unsigned size, Vtable* vt) 
{ 
// 如 果 要 分 配 的 对 象 有 终结 器 就 返回 
if (type_has_finalizer(vt)) return NULL; 


// 如 果 是 大 型 对 象 就 返回 
if ( size > GC_OBJ_SIZE_THRESHOLD ) return NULL; 


Object* p_obj = null; 
Allocator* allocator = thread_get_allocator(); 


int free = (int)allocator->free; 
int ceiling = (int)allocator->ceiling; 
int new_free = free + size; 
if (mew_free <= ceiling) { 
p_obj = (Object*) free; 
allocator->free= (void*)new_free; 
jelse{ 


return null; 


} 


// 向 对 象 头 安装 vtable 指针 
obj_set_vt (p_obj, vt); 
return p_obj; 


} 


这 个 例 程 试图 尽 可 能 快 地 分 配 一 个 对 象 。 特 别 是 当 它 不 能 分 配对 象 时 ， 就 直接 返回 null, 5 
一 个 例 程 gc_alloc () 将 处 理 gc_alloc_fast() 中 失败 的 慢 路 径 的 情况 。 当 编译 器 生成 对 象 分 
配 的 代码 时 候 (比如 JVM 中 的 字 节 码 new 或 newarray 族 )， 它 以 机 器 码 生 成 如 下 的 伪 代 码 。 


p_obj = gc_alloc_fast(size, vt); 

if(p obj == null) { 
prepare_for_native_call(); 
gc_alloc(size, vt); 
clean_after_native_call(); 

} 


慢 路 径 gc_alloc() 可 能 触发 垃圾 回收 , 所 以 编译 器 需要 维护 栈 来 作为 一 个 安全 点 支持 根 集 
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枚 举 。 栈 准备 和 清理 可 能 需要 上 百 条 指令 , 如 果 每 个 对 象 回收 都 需要 执行 的 话 , 代价 就 过 于 昂贵 。 
例 程 gc_alloc_fast () 永 远 不 会 触发 垃圾 回收 ， 因 此 节省 了 栈 维护 的 开销 。 第 10 章 会 讨论 慢 
BEE SCH 


6.10 GC 的 线程 暂停 支持 


当 停 止 世 界 GC 发 生 时 , VM 需要 暂停 所 有 修改 器 以 避免 产生 任何 竞 态 条 件 。 即 使 在 并 发 GC 
中 ， 修 改 器 和 回收 器 可 以 同时 运行 ， 它 通常 也 需要 和 暂停 线程 ， 主 要 是 为 了 根 集 枚 举 。 


6.10.1 GC 安全 点 

在 典型 的 VM 实现 中 ， 并 不 推荐 使 用 暂停 -前 滚 方法 在 一 个 GC 安全 点 暂停 线程 。 最 好 是 修 
改 需 在 一 个 安全 点 检测 到 一 个 回收 事件 的 时 候 暂 停 自身 。VM 需要 为 每 个 GC 安全 点 插入 轮 询 代 
码 。 轮 询 代 码 检查 VM 是 否 触 发 了 回收 事件 ， 如 果 是 的 话 ， 它 就 暂停 当前 线程 。 回 收 结束 后 ， 
VM 发 送 另 一 个 事件 通知 修改 器 从 安全 点 恢复 运行 。 

为 了 概念 化 描述 这 个 设计 ， 可 以 用 两 个 事件 实现 VM 和 线程 间 的 协议 ， 一 个 指示 暂停 请 求 ， 
男 一 个 指示 恢复 请 求 。 暂停 请 求 可 以 是 一 个 由 VM 在 GC 发 生 的 时 候 设 置 的 全 局 标志 , 或 者 是 一 
个 专门 发 送 给 待 暂 停 线 程 的 线程 局 部 数据 。 恢 复 请 求 也 可 以 通过 重 置 同一 个 标志 来 实现 。 

VM 和 目标 线程 之 间 的 交互 如 图 6-4 所 示 。 

vM 目标 线程 









Suspend () j 






等 待 确认 
要 
确认 暂停 进入 安全 点 
已 暂停 
. 
等 待 恢复 里 Safepoint () 
a 
s re 
已 恢复 
离开 安全 点 


图 6-4 ”安全 点 线程 交互 
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其 概念 代码 如 下 。 我 们 需要 在 线程 数据 结构 中 引入 两 个 标志 (或 事件 )。 这 些 标志 可 以 用 
volatile 修饰 ,确保 它们 的 访问 总 是 从 内 存 加 载 ， 并 且 它 们 的 访问 顺序 遵循 程序 顺序 。 在 拥有 
这 两 个 值 的 线程 启动 的 时 候 ， 它 们 都 被 设置 为 FALSE。 


struct VM_Thread{ 


} 


// 其 他 字段 


// VM 设置 ， 请 求 暂停 
volatile bool to_suspend; 
// 自己 设置 ， 指 示 GC 安全 状态 
volatile bool gc_safe; 


void vm_suspend_thread(VM_Thread* target) 


{ 


} 


// 发 送 暂停 请 求 

target->to_suspend = TRUE; 

// 忙 等 目标 确认 暂停 

while( !target->gc_safe ) { 
// 只 是 给 其 他 线程 一 个 检查 运行 的 机 会 
thread_yield(); 

} 

// 目标 确认 暂停 


return; 


void vm_resume_thread(VM_Thread* target) 


{ 


} 


target->to_suspend = FALSE; 


void vm_safepoint () 


{ 


} 


self = current_thread(); 
// 确认 暂停 


self->gc_safe = TRUE; 


// 如 果 有 请 求 ， 暂 停 自己 

// 直到 被 其 他 线程 恢复 

while( self->to_suspend ) { 
thread_yield(); 

} 


// 离开 安全 点 
self->gc_safe = FALSE; 


安全 点 轮 询 代 人 码 也 可 以 设计 为 对 一 个 内 存 地 址 的 写 操 作 。 当 GC 发 生 时 ，VM 为 这 个 位 置 设 
置 写 保护 ， 在 GC 完成 后 再 解除 保护 。 当 GC 发 生 ， 并 且 修 改 器 执行 轮 询 代码 的 时 候 ， 会 触发 一 
个 内 存 保护 异常 ，OS 内 核 会 向 异常 线程 发 送 一 个 事件 。 应 用 程序 已 经 注册 了 一 个 异常 处 理 函数 ， 
将 被 调用 以 处 理 这 个 事件 。 处 理 函 数 通 知 VM 发 生 阻 寨 ,， 然 后 进入 休眠 状态 ， 等 待 GC 完成 后 
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VM 发 出 的 恢复 事件 。 这 种 安全 点 设计 可 能 更 高 效 ， 因 为 快速 路 径 ( 当 GC 不 发 生 时 ) 只 是 一 个 
内 存 写 操作 ， 而 以 上 代码 的 快速 路 径 则 至 少 需要 一 个 内 存 读 操 作 ， 以 及 一 个 对 比 和 分 支 ( compare 
& branch )。 


6.10.2 GC 安全 区 域 
VM 可 能 想 要 在 安全 点 执行 一 些 操作 ( 例如 ， 用 于 根 集 枚 举 ， 或 者 用 于 批量 俩 向 锁 重 置 )。 


不 能 接触 任何 对 象 数据 ， 因 为 那样 是 非 GC 安全 且 违 反 安 全 点 规则 的 。 在 常用 路 径 (以 下 代码 
中 的 “安全 操作 1” 和 “安全 操作 3”) 上 的 操作 应 该 非常 简洁 , 以 保持 安全 点 代码 执行 的 轻 量 化 。 

有 些 VM 设计 要 求 每 个 修改 器 自行 报告 自己 的 根 集 , 而 不 是 由 VM 枚 举 所 有 修改 融 根 集 。 那 
么 可 以 在 安全 点 代码 的 安全 操作 2 处 执行 根 集 枚 举 。 在 线程 开始 枚 举 之 前 , 它 会 检查 自己 是 否 已 
经 有 了 根 集 。 如 果 修 改 器 从 暂停 中 醒 来 后 发 现 ， 在 它 离开 暂停 循环 之 前 已 经 开始 了 又 一 轮回 收 ， 
也 就 是 说 ， 当 它 休眠 的 时 候 ，self->to_suspend 被 设置 为 0， 然后 又 被 设置 为 1， 此 时 已 经 有 
了 根 集 的 情况 是 可 能 的 。 


void vm_safepoint () 


self = current_thread(); 
// 确认 暂停 

self->gc_safe = TRUE; 
self->root_set = NULL; 


TI wae GC 安全 操作 1, TVX no-op 


// 如 果 有 请 求 ， 暂 停 自身 
// 直到 被 其 他 线程 恢复 
while( self->to_suspend ) { 
// GC 安全 操作 2， 可 以 是 no-op 
if( self->root_set == NULL ){ 
self->root_set = thread_enumerate_roots(); 
} 
thread_yield(); 


/7 serves GC 安全 操作 3， 可 以 是 no-op 
// 离开 安全 点 
self->gc_safe = FALSE; 

} 


图 6-5 展示 了 可 以 放置 安全 操作 的 位 置 。 
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VM 目标 线程 






Suspend () 


Safepoint () 


T 离开 安全 点 


图 6-5 线程 可 以 在 安全 点 代码 中 执行 GC 安全 操作 


如 果 把 上 面 “安全 操作 1” 处 的 GC 安全 操作 扩展 为 一 段 大 块 代码 ,那么 可 以 形成 一 个 安全 
区 域 。 安 全 区 域 是 GC 支持 需要 的 男 一 个 场景 。 安 全 区 域 不 是 一 个 点 ， 而 是 一 个 GC 在 其 中 为 安 
全 的 区 域 。 例 如 ， 因 为 本 地 代码 不 直接 接触 对 象 ， 所 以 一 个 遵从 Java 本 地 接口 (JNI) API 的 本 
地 方法 通常 是 GC 安全 的 ， 可 以 被 放 入 安全 区 域 。JIT 编译 涡 不 在 本 地 方法 中 插入 安全 点 ， 所 以 
本 地 方法 不 能 在 中 间 暂 停 。 这 样 ， 如 果 能 保持 整个 JNI 方 法 体 都 是 GC 安全 的 是 很 好 的 。 在 这 个 
意义 上 ， 可 以 把 这 个 本 地 方法 看 作 一 个 大 型 安全 点 。( 这 是 一 个 非常 高 层 的 描述 ， 并 不 精确 。 后 
面 我 们 会 了 解 为 什么 这 么 说 。) 

安全 区 域 的 实现 与 安全 点 的 实现 类 似 , 类 似 于 把 本 地 方法 放 到 安全 点 代码 中 的 “安全 操作 1” 
处 。 唯 一 的 区 别 是 , 现在 为 了 实现 安全 区 域 ,， 把 原来 的 安全 点 实现 分 割 为 两 个 部 分 。 第 一 部 分 在 
安全 区 域 的 入 口 执行 ,第 三 部 分 放 在 出 口 处 。 图 6-6 中 展示 了 VM 和 目标 线程 的 交互 。 
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VM 目标 线程 





暂停 请 求 









Suspend () 


等 待 确认 
” 确认 安全 区 域 


enter saferegion() 





leave _saferegion() 


离开 安全 区 域 


图 6-6 ”安全 区 域 线程 之 间 的 交互 


vm_thread_suspend() 的 代码 和 前 面 一 样 。 安 全 区 域 部 分 的 代码 则 变 成 下 面 这 样 。 


void thread_enter_saferegion () 
{ 
self = current_thread(); 
// 不 管 有 没有 请 求 
// 先 声 明 我 们 对 GC 是 安全 的 
self->gc_safe = TRUE; 
} 


void thread_leave_saferegion() 
{ 
self = current_thread(); 
// 如 果 有 请 求 ， 暂 停 自身 
while( self->to_suspend ) { 
thread_yield(); 
} 
// 离开 安全 区 域 
self->gc_safe = FALSE; 
} 


bool thread_in_saferegion() 
{ 
self = current_thread(); 
return self->gc_safe; 


} 
基于 以 上 的 讨论 ,安全 点 和 安全 区 域 几乎 是 同一 个 东西 。 安 全 点 意味 着 它 是 唯一 允许 回收 发 生 
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的 点 ,而 安全 区 域 意味 着 在 整个 区 域 范 围 内 回收 都 是 可 以 的 。 所 以 thread_enter_saferegion () 
和 thread_leave_saferegion () 这 一 对 有 时 候 也 被 称 为 vm_enable_ gc() 和 vm_disable gc()。 
实际 上 ， 可 以 通过 调用 安全 区 域 代码 实现 安全 点 。 
void vm_safepoint () 
{ 
thread_enter_saferegion(); 


thread_leave_saferegion(); 
} 


当 进 入 操作 和 离开 操作 分 为 两 部 分 时 , 有 可 能 中 间 的 安全 操作 会 调用 男 一 个 本 地 方法 , 甚至 
是 Java 方 法 。 换 句 话 说 ,控制 流 可 能 走出 安全 区 域 。 现 实 中 这 是 很 常见 的 。VM 设计 应 该 确保 在 
调用 链 上 很 好 地 维护 了 GC 安全 状态 。 


O Java 代码 是 非 GC 安全 的 ， 本 地 方法 是 GC 安全 的 。 

口 当代 码 从 Java 方 法 进入 本 地 方法 时 ， 它 就 进入 安全 区 域 。 

口 如 果 代 码 从 本 地 方法 进入 Java 方 法 ， 本 地 代码 离开 安全 区 域 。 

第 9 章 会 详细 讨论 ， 当 Java 和 本 地 代码 交互 时 ， 为 何以 及 如 何在 VM 中 维护 这 一 变化 。 


6.10.3 ”基于 锁 的 安全 点 


如 果 深 入 查看 线程 交互 的 实现 代码 ， 可 以 发 现 这 个 思路 和 Peterson 的 互 斥 算法 类 似 。 这 里 的 
语义 是 VM 和 目标 线程 竞争 获得 对 象 访问 ( 或 堆 修改 ) 权 。 想 要 回收 垃圾 的 VM 试图 获得 修改 锁 。 
修改 融通 党 持 有 这 个 锁 , 它 会 时 不 时 地 在 不 修改 堆 的 时 候 , 也 就 是 在 安全 点 和 安全 区 域 释放 它 的 
修改 锁 。 换 句 话 说， 进入 安全 区 就 像 是 释放 修改 锁 ， 意 味 着 这 个 线程 此 时 不 会 修改 堆 ， 而 是 让 回 
收 需 去 获得 这 个 锁 。 


在 这 个 概念 模型 中 ， 用 于 线程 暂停 的 数据 结构 可 以 把 那 两 个 volatile 标志 替换 为 一 个 可 重 人 
阻塞 锁 (或 monitor )。 


struct Thread{ 
// 其 他 字段 


// 用 于 堆 修改 权限 的 锁 
Lock* mutable; 
} 


void vm_suspend_thread(VM_Thread* target) 
{ 

lock( target->mutable ); 
} 


void vm_resume_thread(VM_Thread* target) 
{ 

unlock( target->mutable ); 
} 
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void thread_enter_saferegion() 

{ 
VM_Thread* self = current_thread(); 
unlock( self->mutable ); 

} 


void thread_leave_saferegion() 

{ 
VM_Thread* self = current_thread(); 
lock( self->mutable ); 

} 


void vm_safepoint () 
{ 
VM_Thread* self = current_thread(); 
unlock( self->mutable ); 
lock( self->mutable ); 
在 以 上 实现 中 , 这 个 算法 重用 了 锁 语 义 , 由 此 得 到 对 等 待 和 通知 的 支持 。 当 一 个 锁 被 释放 时 ， 
所 有 的 等 待 线程 会 竞争 这 个 锁 。 例 如 , 在 一 个 安全 点 上 , 线程 可 能 释放 并 立即 获取 这 个 锁 ， 即 使 
VM (比如 回收 器 ) 正在 等 待 这 个 锁 。 在 多 数 系统 中 ， 锁 的 实现 确保 了 公平 性 ， 等 待 线程 应 该 能 
人 够 在 确定 时 间 内 获得 锁 〈 比如 下 一 个 安全 点 )， 这 就 不 是 一 个 问题 。 或 者 可 以 在 安全 点 的 解锁 和 
锁定 中 间 插 入 一 个 thread_yield() 来 确保 有 一 个 等 待 线 程 可 以 有 机 会 获得 这 个 锁 。 
但 是 实际 实现 中 不 太 可 能 使 用 这 个 基于 锁 的 设计 , 因为 锁定 和 解锁 操作 对 安全 点 来 说 可 能 过 
于 昂贵 , 更 不 用 提 thread_yield() 了 。thread_in_saferegion() 的 实现 也 可 能 是 有 问题 的 ， 
因为 通常 没有 用 来 判断 一 个 线程 是 否 持 有 一 个 锁 的 直接 原 语 。 


6.10.4 回收 中 的 线程 交互 


如 果 GC 需要 停止 世界 ，VM 可 以 使 用 上 面 的 原 语 来 逐个 暂停 所 有 修改 器 。VM 实现 不 一 定 
要 使 用 专用 线程 来 暂停 修改 右 。 暂 停 其 他 修改 右 的 线程 本 身 也 可 能 是 一 个 修改 器 ,因为 回收 可 能 
是 这 个 修改 器 由 于 堆 空 间 不 足 而 无 法 成 功 分 配对 象 时 被 触发 的 ,这 个 修改 器 陷入 VM 代码 来 启动 
垃圾 回收 。 


有 可 能 出 现 多 个 修改 器 都 分 配对 象 失败 , 同时 试图 触发 GC 的 情况 , 特别 是 在 并 行 计算 机 中 。 
这 些 修 改天 中 的 每 一 个 都 可 能 试图 和 暂停 其 他 修改 器 ， 这 样 会 导致 相互 暂停 死 锁 。 为 了 避免 死 锁 ， 
使 用 一 个 全 局 锁 是 安全 的 , 这 个 全 局 锁 只 人 允许 一 个 修改 器 暂停 其 他 修改 融 , 如 下 面 给 出 的 代码 实 
现 所 示 。 其 思路 是 只 人 允许 一 个 中 央 控 制 来 执行 停止 世界 暂停 。 持 有 这 个 全 局 锁 也 可 以 防止 系统 创 
建 可 能 逃离 暂停 的 新 线程 。 

void vm_suspend_all_threads() 

{ 


// 这 是 关键 。 下 面 可 能 出 现 的 暂停 操作 ……: 
// 需要 处 于 安全 区 域 
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assert ( thread_in_saferegion()); 


// 获得 全 局 锁 ， 可 能 阻塞 
global_thread_lock() ; 


for( each target thread ) { 
vm_suspend_thread( target->mutable ); 
} 


} 


void vm_resume_all_threads () 
{ 


for( each target thread) { 
vm_resume_thread( target->mutable ); 


} 


// 释放 全 局 锁 
global_thread_unlock(); 
} 


当 多 个 修改 器 分 配 新 对 象 失 败 并 同时 触发 GC 时 ,它们 可 以 竞争 全 局 暂停 锁 。 其 中 一 个 赢得 
这 个 锁 并 执行 暂停 。 其 他 参与 竞争 的 修改 费 会 等 待 这 个 锁 。 在 这 个 锁 上 等 待 不 是 个 问题 ,因为 它 
们 处 于 安全 点 (或 安全 区 域 )。 

上 面 这 个 算法 的 问题 是 , 当 VM 释放 全 局 锁 并 恢复 所 有 等 待 全 局 锁 的 修改 器 时 , 被 唤醒 的 修 
改天 会 竞争 全 局 锁 。 其 中 赢得 锁 的 修改 器 会 启动 又 一 轮 修改 器 暂停 ， 尽 管 它 们 刚刚 被 暂停 过 。 

在 实际 的 实现 中 ， 可 以 把 全 局 暂停 锁 的 获取 和 释放 放 在 外 层 调 用 者 中 停止 世界 之 前 /之 后 的 
位 置 。 把 它们 放 在 外 面 是 有 用 的 ,因为 修改 器 获得 全 局 锁 之 后 , 可 以 在 实际 锁定 世界 之 前 再 次 检 
查 堆 空间 能 否 满足 对 象 分 配 需求 。 这 可 以 避免 等 待 全 局 锁 的 多 个 修改 器 接连 停止 世界 的 情况 , A 
为 后 面 赢得 锁 的 修改 咒 也 许 能 够 找到 可 用 自由 空间 , 然后 就 会 退出 回收 过 程 。 如 果 修 改天 在 获得 
锁 之 后 发 现 堆 空 间 仍 然 不 足 ， 会 执行 真正 的 停止 世界 操作 ， 如 以 下 代码 所 示 。 


void vm_trigger_gc() 
{ 
thread_enter_saferegion(); 


if( !theap_is_low() ) return; 


global_thread_lock(); 


if( !heap_is_low() YA 
global_thread_unlock(); 
return; 


} 


vm_suspend_all_threads() ; 
vm_reclaim_heap() ; 
vm_resume_all_threads(); 
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global_thread_unlock(); 
thread_leave_saferegion(); 


return; 

} 

如 以 上 代码 所 示 , 触发 回收 的 线程 应 该 在 安全 区 域内 ,因为 当 它 获 取 全 局 线程 锁 的 时 候 可 能 
阻塞 。 阻 塞 线 程 应 该 允许 回收 发 生 。 

事实 上 , 触发 回收 的 线程 确实 在 安全 区 域内 , 因为 如 果 GC 由 对 象 分 配 触发 , 分 配点 应 该 是 Java 
代码 中 的 一 个 安全 点 , 所 以 线程 在 可 能 被 阻塞 的 锁定 操作 之 前 调用 thread_enter_saferegion () 
不 是 一 个 问题 。 如 果 分 配 来 自 本 地 方法 ,那么 它 本 身 就 在 安全 区 域内 。 如 果 GC 是 由 系统 直接 调 
用 GC 触发 ,那么 它 是 一 个 调用 点 ， 同 时 也 是 一 个 安全 点 。 le 


Zz 一 


第 三 部 分 


虚拟 机 内 部 支持 





Ble 本 地 援 口 





在 对 即时 (JIT) 编译 、 垃 圾 回收 ( GC ) 和 线程 的 介绍 过 程 中 ， 我 们 提 到 了 几 个 需要 虚拟 机 
(VM ) 内 部 提供 支持 的 核心 功能 。 第 三 部 分 的 章节 中 将 详细 讨论 这 些 主题 。 


7.1 为 何 需要 本 地 接口 


高 级 语言 需要 本 地 接口 来 访问 底层 系统 资源 和 VM 服务 。 由 于 安全 性 、 可 移植 性 和 实现 方面 
的 原因 ， 它 们 不 能 直接 访问 底层 资源 。 
口 安全 原因 : 高 级 语言 不 允许 直接 操纵 内 存 地 址 、 机 器 指令 和 输入 /输出 (1/O ) 接口 等 资 
源 。 当 程序 需要 处 理 底层 逻辑 ， 或 者 需要 提供 高 性 能 时 ， 这 些 访 问 是 必要 的 。 
口 可 移植 性 原因 : 高 级 语言 本 质 上 是 平台 无 关 的 。 要 访问 平台 特定 的 功能 ， 比 如 文件 系 
统 ， 它 就 需要 使 用 平台 的 本 地 语言 。 
口 实现 原因 : 有 时 候 ， 有 些 库 只 有 本 地 语言 的 实现 可 用 ， 比 如 没有 移植 到 高 级 语言 或 者 只 

在 遗留 实现 中 存在 的 媒体 库 。 

为 了 跨越 这 些 鸿沟 ， 高 级 语言 需要 在 它 的 VM 中 实现 本 地 接口 。 这 里 的 “本 地 ”( native ) 是 
指 这 个 接口 提供 了 对 VM 之 下 操作 系统 (OS ) 本 地 语言 的 访问 。 当 前 多 数 可 用 的 OS 本 地 语言 
Cif, PRL Java 本 地 接口 (JNI ) 提供 C 语言 访问 是 合理 的 , 但 JVM 也 不 排除 用 其 他 语言 编写 
本 地 方法 。 

本 地 接口 设计 具有 如 下 属性 。 

本 地 语言 : 一 个 OS 的 本 地 语言 不 一 定 是 C 语 言 ， 甚 至 也 不 一 定 是 低级 语言 。 这 都 取决 

于 实现 。 对 基于 Java 的 OS 来 说 ， 可 以 把 Java 看 作 这 个 OS 的 本 地 语言 。 但 是 ， 除 非 

OS 的 硬件 设计 以 某 种 方式 支持 安全 编程 ， 和 否则 这 样 的 OS 仍然 需要 能 访问 底层 硬件 或 

系统 资源 的 本 地 接口 。 最终 的 问题 是 ， 可 以 用 计算 机 建 模 的 这 个 世界 本 身 是 否 安 全 。 如 

果 答 案 是 否定 的 ,那么 在 安全 世界 与 非 安全 世界 的 边界 处 总 是 需要 一 个 本 地 接口 。 因 此 ， 

本 地 语言 可 以 比 C 更 低级 或 更 高 级 ， 只 要 接口 惯例 具有 良好 的 定义 即 可 。 

本 地 代码 到 托管 代码 : 定义 本 地 接口 不 止 是 为 了 让 高 级 语言 访问 低级 语言 也 是 为 了 反 
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向 访问 ， 即 低级 语言 访问 高 级 语言 。 从 低 到 高 的 访问 也 是 需要 的 ， 否 则 就 没有 办 法 从 

OS 访问 VM 系统 ,或 者 从 本 地 代码 回调 到 高 级 程序 .例如 ,用 C 编 写 的 在 一 个 网 络 socket 

侦 听 的 应 用 程序 被 一 个 socket 事件 唤醒 ， 然 后 调用 以 Java 程序 编写 的 事件 处 理 函 数 。 

数据 共享 : 定义 本 地 接口 的 目的 不 只 是 为 了 高 级 语言 与 低级 语言 之 间 的 代码 访问 , 也 是 

为 了 它们 之 间 的 数据 共享 ,低级 语言 应 该 能 够 访问 高 级 语言 创建 的 数据 。 同 时 也 需要 高 

级 语言 能 够 访问 低级 语言 创建 的 数据 。 

高 级 属性 : 尽管 本 地 接口 的 设计 目的 是 访问 低级 语言 ,但 它 也 是 高 级 语言 设计 的 一 部 分 。 

这 意味 着 ， 本 地 接口 的 应 用 程序 接口 ( API ) 不 应 该 破坏 高 级 语言 重要 的 安全 属性 。 例 

如 ， 对 于 本 地 代码 ， 对 象 的 布局 应 该 还 是 不 透明 的 。 本 地 代码 应 该 仍然 可 以 看 到 同样 的 

异常 抛 出 过 程 。 

只 有 程序 是 用 “本 地 接口 ”编写 的 时 候 ， 安 全 性 才 可 能 被 保持 ， 因 为 本 地 接口 是 在 VM 的 控 
制 之 下 。 用 “本 地 代码 ”编写 但 并 不 遵循 “本 地 接口 ”的 程序 并 不 保持 安全 性 。 本 地 代码 可 以 做 
它 设计 范围 内 的 任何 事情 。 它 可 以 用 低级 语言 API 分配 虚 拟 内 存 ， 创建 本 地 线程 ， 等 等 。 然 而 这 
些 实体 不 由 VM 管理 ， 而 是 由 低级 语言 的 实现 管理 。 举 例 来 说 , 本 地 代码 直接 分 配 的 虚拟 内 存 不 
是 VM 的 垃圾 回收 对 象 。 

最 近 几 年 ，Web 应 用 程序 变 得 流行 起 来 ， 其 中 的 高 级 编程 语言 是 HTML/JavaScript。Web 应 
用 程序 的 VM 称 为 Web 运行 时 ， 通 常 谍 入 在 Web 浏览 器 中 。 因 此 ， 尽 管 在 Web 浏览 器 社区 内 ， 
术语 “本 地 语言 ”和 Java 社区 中 一 样 是 指 C/C++， 但 在 Web 应 用 程序 社区 中 ,“ 本 地 语言 ” 指 
的 是 不 同 的 东西 。 

例如 ，Web 应 用 社区 把 Java PRN Android 的 本 地 语言 ， 因 为 Android 的 主要 编程 序 语言 是 Java, 
而 不 是 Web 编程 语言 HTML/JavaScript。 类 似 地 ,Web 应 用 程序 社区 中 iOS 的 本 地 语言 是 Objective-C 
或 Swift。 但 是 ， 对 Chrome 或 Safari 浏览 器 开发 者 (不 是 Web 应 用 程序 开发 者 ) 来 说 ，Web iz 
行 时 的 本 地 语言 仍然 是 C/C++， 因 为 这 是 实现 Web 运行 时 并 提供 底层 资源 访问 的 语言 。 

在 本 章 随 后 的 内 容 里 ,我 们 以 JNI 为 例 讨论 常用 本 地 接口 实现 的 细节 ,但 其 设计 并 不 局 限 
= INL. 


7.2 ”从 托管 代码 到 本 地 代码 的 转换 


本 地 接口 的 首要 需求 是 支持 托管 代码 调用 本 地 代码 , 以 及 反 癌 调用。 那么 关键 点 就 是 在 两 个 
世界 之 间 达 成 一 个 调用 惯例 共识 。 调 用 惯例 定义 了 程序 控制 流 从 一 个 函数 (或 方法 ) 转 入 或 转 出 
的 应 用 程序 二 进 制 接口 (Application Binary Interface, ABI )， 也 就 是 如 何 传递 参数 和 返回 值 ， 以 
及 如 何 准 备 和 恢复 栈 。 有 时 还 需要 维护 支持 调试 、 异 常 处 理 和 垃圾 回收 需求 的 栈 帧 信息 。 一 旦 定 
义 了 某 种 语言 在 某 个 平台 上 的 调用 惯例 , 任何 在 这 个 平台 上 为 这 种 语言 生成 代 人 码 的 编译 器 都 应 该 
遵循 这 个 惯例 。 不 同 语言 的 代码 如 果 都 遵循 同一 个 调用 惯例 的 话 ， 彼 此 之 间 也 可 能 交互 。 
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本 地 代码 由 另 一 个 编译 器 编译 ， 它 不 同 于 VM 的 JIT 编译 占 。 通 常 本 地 代码 编译 器 也 不 是 
VM 的 一 部 分 。 换 句 话说， 本 地 代码 的 调用 惯例 不 是 由 VM 定义 的 。 如 果 托 管 代 码 想 要 与 本 地 代 
码 交 互 , 它 应 该 遵循 本 代码 的 调用 惯例 。 也 就 是 说 , 为 了 支持 JNI, SVM 应 该 了 解 C 的 调用 惯例 。 


7.2.1 ”本 地 方法 封装 


JVM 中 实现 本 地 调用 的 一 个 常用 方法 是 ， 生 成 封装 代码 来 处 理 Java 代码 与 本 地 代码 的 调用 
惯例 转换 。 封 装 代码 执行 控制 流传 递 所 需 的 所 有 准备 和 维护 工作 ， 如 图 7-1 和 图 7-2 所 示 。 
(源码 中 ) 期 望 的 控制 流 语义 : 


Java 代 三 本 地 代码 


return; 





图 7-1 直接 调用 期 望 的 控制 流 
(汇编 码 中 ) 实际 的 控制 流 : 
(编译 后 的 ) 封装 代码 (编译 后 的 ) 
Java 代 码 本 地 代码 


foo wrapper: 






a 


push this 








push para 


call 





foo_wrapper 





1 
t 
1 
1 
! 
1 
I 
1 
| call foo 
[i 
1 
l 
t 
t 
t 
t 


ee ae) 


图 7-2 本 地 调用 的 封装 代码 


JIT 编译 器 在 编译 调用 方 的 Java 代码 时 ， 生 成 一 条 到 封装 代码 的 调用 指令 ， 然 后 封装 代码 调 
用 到 实际 的 本 地 代码 。 封 装 代码 对 Java 调用 方 遵循 Java 调用 惯例 ， 对 本 地 被 调用 方 遵循 本 地 调 
用 惯例 。 为 了 实现 桥接 ,特别 是 对 Java 调用 方 来 说 ， 本 地 方法 要 看 起 来 就 像 是 一 个 Java 方 法 ， 
它 需 要 做 以 下 几 件 事情 : 
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口 参数 准备 与 恢复 ; 

O 栈 展 开支 持 ; 

口 垃圾 回收 支持 ; 

口 异常 支持 ; 

口 同步 支持 。 

本 音 只 讨论 关于 参数 的 第 一 条 , 其 余 几 条 留待 后 续 章 节 介绍 。 编 译 时 生成 代码 与 解释 器 运行 
时 代码 可 以 用 同样 的 逻辑 实现 。 

为 了 在 Java 中 调用 一 个 方法 ，JVM 规范 定义 了 字 节 码 级 调用 惯例 。 参 数 从 左 到 右 压 栈 。 方 
法 返回 时 清理 被 调用 方 栈 帧 。 与 之 相对 的 是 ，C 语言 参数 奈 栈 的 顺序 是 从 右 到 左 ， 参 数 由 调用 方 
清理 ， 因 为 被 调用 方 不 一 定 知道 调用 方 压 栈 参 数 的 个 数 。 


还 有 一 个 值得 注意 的 区 别 。JVM 中 实例 方法 调用 ( 字 节 码 invokevirtual ) 的 第 一 个 参数 
是 当前 实例 引用 this， 它 是 被 调用 方 栈 帧 上 位 于 槽 位 0 的 局 部 变量 。 参 数 this 在 实例 方法 签 
名 定义 中 不 是 显 式 的 。 对 静态 Java 方法 调用 来 说 ，JVM 没有 这 种 隐 式 参数 。 对 本 地 方法 调用 来 
说 ，JVM 要 求 虚 拟 本 地 方法 像 Java 一 样 把 this 引用 作为 参数 传递 ， 而 静态 本 地 方法 要 求 传递 
类 实例 引用 。 另 外 ， 还 需要 传递 一 个 JNI 环 境 变量 ， 甚 中 存储 了 一 个 所 有 INI API 的 函数 表 ， 以 
支持 本 地 方法 访问 所 有 需要 的 JVM 资源 。 


下 面 是 一 个 展示 封装 支持 的 示例 。 
Java 代码 中 的 Java 方 法 如 下 所 示 : 


public class Add{ 
public static native int native_add(int x, int y); 
public static int java_add(int x, int y); 
public static int add(int x, int y){ 
return native_add(x, y); 
} 
} 


为 以 上 的 Java 方 法 aaa(x，y) 生 成 的 字 节 码 如 下 所 示 : 


0: iload_0O 
Ts: lea 1 
2: invokestatic #2 // Method native_add:(II)I 
5: ireturn 


如 前 所 述 ， 静 态 方法 调用 ( 字 节 码 invokestatic) 实际 上 是 用 一 条 到 目标 本 地 方法 
native_add() 的 封装 代码 的 调用 实现 的 。JIT 编译 器 以 与 调用 静态 Java 方法 相同 的 方式 为 
invokestatic 生成 代码 ， 只 不 过 调用 目标 变 成 了 封装 代码 。 控 制 流 进 入 封装 代码 后 , 运行 时 栈 
如 图 7-3 所 示 ， 就 像 进入 了 静态 Java 方 法 一 样 。 栈 顶 是 返回 地 址 ， 紧 接着 是 两 个 参数 。 
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图 7-3 调用 Java 方 法 之 后 的 栈 数 据 


本 地 方法 native_add (x，y) 应 该 用 如 下 定义 实现 。 它 被 调用 之 前 所 期 望 看 到 的 相应 栈 数 
据 如 图 7-4 所 示 。 


JNIEXPORT jint JNICALL Java_Add_native_ladd 
(JNIEnv *, jclass, Jint, jint); 


栈 指针 





| MI env | 
pers ees) 
ee eee 





图 7-4 ”调用 本 地 方法 之 前 的 栈 数据 
准备 相应 的 栈 数据 是 封装 代码 的 责任 。 
图 7-3 是 封装 代码 看 到 的 栈 ， 图 7-4 是 调用 本 地 方法 之 前 封装 准备 的 栈 。 栈 上 数据 合 起 来 的 


样子 如 图 7-5 所 示 。 在 这 个 JNI 实 现 中 ，Java 调用 方 原本 准备 的 栈 仍 然 保 存 完好 ， 将 在 封装 代码 
返回 时 被 清理 。 


t 


xéturn 1BG 





图 7-5 包含 本 地 方法 参数 的 栈 数据 


7.2.2 封装 代码 的 GC 支持 


在 调用 方 Java 方 法 内 , 它 的 被 调用 方 保存 寄存 人 ( callee-saved register ) 中 可 能 有 对 象 引用 ， 
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需要 在 调用 本 地 方法 之 前 小 心 处 理 ， 原 因 如 下 。 

(1) 如 果 被 调用 方 本 地 方法 ( 或 者 在 它 调用 链 上 的 任何 方法 ) PRE GC 的 话 ，VM 需要 枚 
举 栈 上 和 寄存 器 中 的 所 有 根 引 用 。 

(2) 因为 本 地 代码 是 由 其 他 编译 器 编译 的 ， 所 以 JVM 不 了 解 来 自 于 调用 方 Java 方 法 的 哪些 
被 调用 方 保存 寄存 器 已 被 保存 ， 以 及 保存 在 本 地 代码 栈 帧 中 的 何 处 。 

在 调用 本 地 方法 之 前 ,保存 所 有 调用 方 Java 方法 的 被 调用 方 保存 寄存 器 ， 可 以 确保 所 有 引 
用 都 保存 在 了 对 GC 来 说 安全 的 地 方 。 假 定 在 X86 平台 上 的 被 调用 方 保 存 寄存 器 是 ebpp、ebx、 
esi 和 edi， 那 么 栈 看 起 来 就 如 图 7-6 所 示 。 





图 7-6 保留 被 调用 方 保 存 寄存 器 的 栈 数据 


然后 封装 代码 看 起 来 如 下 所 示 : 


// 首先 保存 被 调用 方 保存 寄存 器 

push ebp 

Push ebx 

push esi 

push edi 

// 压 栈 本 地 方法 参数 

push [esp+20] // ARY 

push [esp+28] // AERX 

push addr_class_Add // Fae Add 类 实例 
push addr_JNI_Env - // AR INI 环境 变量 
// 调用 实际 的 本 地 方法 实现 

call Java_Add_native_ladd 

// 本 地 方法 为 stdcall， 不 需要 弹出 参数 

// 恢复 被 调用 方 保存 寄存 器 

pop edi 

pop esi 

pop ebx 

pop ebp 

// 返回 并 弹出 Java K(x, y) 

ret 8 
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这 是 一 个 高 度 简 化 的 版 本 ， 因 为 其 中 没有 包括 栈 展 开 、 垃 圾 回收 、 同 步 和 异常 支持 。 甚 至 对 
于 参数 准备 , 它 也 没有 展示 单个 参数 可 能 占据 栈 上 两 个 槽 位 的 情况 , 比如 Long 和 double 类 型 。 
下 一 节 将 简单 介绍 同步 本 地 方法 支持 ， 以 后 再 介绍 其 他 主题 。 


7.2.3 封装 代码 的 同步 支持 


如 果 一 个 Java 方 法 被 声明 为 synchronized， 编 译 器 会 在 方法 起 始 为 monitorentet 生成 
代码 ， 在 方法 结尾 为 monitorexit 生成 代码 。monitorenter 的 位 置 是 GC 安全 点 ， 因 此 如 果 
当前 线程 在 执行 monitorenter 的 时 候 需要 等 待 monitor， 那 么 不 会 阻塞 GC。 如 果 一 个 本 地 方 
法 被 声明 为 synchronized, Hif <5 Java 方 法 中 相同 。 


因为 本 地 方法 由 平台 编译 需 编 译 ， 所 以 就 没有 为 monitorenter 或 monitorexit 生成 代 
码 。monitorenter 和 monitorexit 逻辑 的 插 和 人 就 必须 放 在 Java 到 本 地 的 封装 代码 中 实现 , 这 
是 在 VM 控制 之 下 的 。 下 面 给 出 一 个 针对 同步 本 地 方法 的 封装 示例 。 


// 首先 保存 被 调用 方 保存 寄存 器 

push ebp 

push ebx 

push esi 

push edi 

// ÆR monitor 对 象 ， 用 于 monitorenter 
push addr_class_Add 

call vm_object_lock 


// 压 栈 本 地 方法 参数 


push [esp+20] // ARY 

push [esp+28] // ERX 

push addr_class_Add // AR Add 类 实例 
push addr_JNI_Env // ÆR INI 环境 变量 


// 调用 实际 本 地 方法 实现 

call Java_Add_native_ladd 

// 本 地 方法 为 stdcal1， 不 需要 弹出 参数 
// 压 栈 monitor 对 象 ， 用 于 monitorexit 
push addr class Add 

call vm object unlock 

// 恢复 被 调用 方 保存 寄存 器 

pop edi 

pop esi 

pop ebx 

pop ebp 

// 返回 并 弹出 Java 参数 (x，y) 

ret 8 


作为 Java 方 法 编译 的 对 应 过 程 ， 生 成 封装 代码 的 过 程 有 时 被 称 为 “本 地 方法 编译 "。 它 不 会 
与 本 地 编译 器 的 编译 相 混 清 , 因为 JVM 中 没有 本 地 编译 器 。JIT 编译 器 不 会 编译 本 地 方法 ,因此 
“本 地 方法 编译 ”只 生成 封装 代码 ， 并 为 每 个 本 地 方法 生成 一 段 封装 代码 。 

注意 ， 其 他 JVM 实现 或 者 本 地 语言 实现 的 调用 惯例 可 能 与 我 们 在 此 使 用 的 不 同 。 这 里 的 示 
例 只 是 为 了 展示 设计 逻辑 。 
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7.3 本 地 方法 实现 的 绑 定 


封装 代码 由 JVM 生成 。 为 了 让 封装 代码 调用 本 地 方法 ，JVM 应 该 能 够 找到 本 地 入 口 点 的 地 
址 。 本 地 方法 可 能 由 SVM 实现 , 可 能 作为 内 建 库 静 态 链接 到 JVM, 还 可 能 被 构建 为 动态 链接 库 ， 
并 由 JVM 在 运行 时 加 载 。 


为 了 定位 一 个 本 地 方法 ，JVM 可 以 搜索 它 的 本 地 方法 表 ( 可 能 不 止 一 个 )， 其 中 包括 内 建 的 
本 地 方法 ， 以 及 Java 应 用 程序 用 INI K% RegisterNatives ce 如 果 这 个 本 地 
方法 不 为 JVM 所 知 , 那么 JVM 会 继续 用 函数 名 在 所 有 已 加 载 动 态 库 中 搜索 。 这 个 函数 名 是 用 多 
个 mangling 方案 之 一 创建 的 ， 因 为 本 地 编译 需 编 译 的 本 地 方法 使 用 的 名 称 mangling 生成 的 函数 
名 ， 可 能 不 同 于 Java 代码 中 声明 的 男 数 名 。 如 果 无 法 找到 并 绑 定 被 调用 的 本 地 方法 ， 就 会 抛 出 
一 个 异常 。 定 位 了 这 个 本 地 方法 之 后 ，JVM 会 为 它 生 成 封装 代码 来 调用 它 。 

封装 代码 生成 之 后 ,就 会 被 当 作 本 地 方法 的 JIT 编译 代码 来 对 待 ,方式 几乎 和 JIT 编译 的 Java 
代码 一 样 。 在 JIT 编译 的 Java 代码 看 来 ,这 个 封装 代码 的 入 口 点 就 是 本 地 方法 的 入 口 。 如 果 这 个 
方法 是 虚拟 的 ，vtable 中 的 相应 条 目 也 要 更 新 。 


7.4 本 地 代码 到 托管 代码 的 转换 
本 地 方法 应 该 能 够 操作 Java 方 法 生成 的 对 象 ， 包 括 数据 访问 和 方法 调用 。 
JNI 规 范 提供 了 用 于 本 地 方法 调用 Java 方 法 的 API。 这 些 API 应 该 由 JVM 实现 ， 如 下 所 示 。 


jint JNICALL CallStaticIntMethod(JNIEnv* jenv, 
jclass clazz, 
jmethodID method, 
pay 





这 个 API 允许 本 地 代码 用 可 变 参 数 调用 某 个 类 clazz 的 static 方法 method, 返回 值 类 型 
为 jint。 它 的 函数 指针 注册 在 JNI 环 境 变量 jenv 中 ， 本 地 代码 可 以 在 其 中 找到 这 个 函数 指针 。 
下 面 给 出 一 段 从 本 地 方法 调用 Java 方 法 的 示例 代码 : 


// 本 地 方法 Add. native_ladd() # A Add. java_add() 
JNIEXPORT jint JNICALL Java_Add_native_add 

(JNIEnv *jenv, jclass clazz, jint x, jint y) 
{ 


jmethodID mid = (*jenv)->GetStaticMethodID(jenv, clazz, 
ava adat; GIL) I™ Je 
int sum = (*jenv)->CallStaticIntMethod(jenv, clazz, 


Mid, 2, OF 
return sum; 


} 

为 了 支持 这 类 API, JVM 所 做 的 基本 上 就 是 准备 参数 ， 调 用 Java 方法 ， 然 后 读 取 返 回 值 。 它 还 
会 检查 Java 方法 执行 是 否 抛 出 任何 异常 。 不 需要 为 每 个 Java 方 法 生成 封装 ， 因 为 代码 路 径 都 是 一 
样 的 。 这 与 从 托管 代码 到 本 地 代码 的 转换 是 不 同 的 ， 那 种 情况 下 会 为 每 个 本 地 方法 生成 封装 代码 。 
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这 个 区 别 的 原因 在 于 ，JVM 不 想 参 与 从 托管 代码 到 本 地 代码 的 转换 过 程 。 它 试图 在 编译 时 
生成 封装 代码 ,然后 在 转换 过 程 中 只 有 封装 代码 运行 。 如 果 对 于 所 有 本 地 方法 ,封装 代码 都 是 一 
FER, 那么 它 就 必须 编 人 逻辑 来 检查 目标 本 地 方法 是 否 为 静态 ,是 否 为 同步 ， 然 后 根据 不 同情 况 
进入 不 同 的 路 径 。 它 还 需要 插入 逻辑 来 检查 参数 数量 和 每 个 参数 的 类 型 ， 然 后 据 此 准备 栈 参 数 。 
如 果 每 个 本 地 方法 调用 都 要 涉及 这 些 逻 辑 , 那么 执行 速度 就 太 慢 了 , 更 不 要 说 还 有 后 面 将 要 介绍 
的 栈 展 开 和 垃圾 回收 支持 。 

如 果 这 个 负担 只 在 编译 时 承担 一 次 , 并 且 运 行 时 路 径 只 需要 执行 必要 的 代码 即 可 , 那么 执行 
速度 就 会 快 得 多 。 通 过 为 每 个 本 地 方法 建立 一 个 单独 的 封装 代码 ， 这 种 设计 以 内 存 空间 为 代价 ， 
换取 了 运行 时 性 能 。 更 重要 的 是 ,这 个 折 中 方案 是 可 能 实现 的 ,因为 多 数 本 地 方法 相关 的 信息 都 
是 编译 时 可 用 的 ,因此 每 次 执行 时 不 需要 在 运行 时 检查 或 询问 。 前 面 已 经 提 到 , 封装 代码 被 看 作 
“编译 后 的 ”本 地 方法 的 一 部 分 。 

相 比 之 下 ， 从 本 地 到 Java 的 转换 逻辑 就 要 简单 得 多 。 更 重要 的 是 ， 本 地 代码 由 本 地 语言 编 
译 天 编译。 编译 时 ,编译 需 无 法 获得 Java- 方 法 的 信息 。 它 需要 通过 JNIAPI 利 用 Java 的 反射 机 制 
获取 方法 及 其 签名 信息 。 这 只 有 在 执行 本 地 方法 的 运行 时 才能 发 生 。 即 便 如 此 ， 为 每 个 Java 方 
法 生成 一 段 封装 代码 ， 以 获得 更 快 的 本 地 代码 到 托管 代码 的 转换 速度 ， 这 也 是 可 能 的 。 

当 JVM 运行 时 收 到 对 CallstaticIntMethod 这 样 的 INI API 的 调用 时 ， 它 会 基于 Java if 
义 执 行 一 些 必要 检查 , 然后 调用 一 段 桥接 代码 。 这 段 桥接 代码 执行 的 是 对 封装 代码 在 本 地 方法 上 
的 操作 的 反 向 操作 ， 如 图 7-7 所 示 。 


(编译 后 ) 
本 地 代码 本 地 到 Java 桥 接 代码 Java 代 码 
native_add: native to jave call; java_add: 







IcallStaticint 


Method (ada) 









ooo a te 
Eoo o a 

! joie 
-o return 





一 一 一 一 一 一 一 一 一 一 一 一 一 一 2 


图 7-7 本 地 代码 到 Java 代码 的 桥接 


在 下 面 的 示例 代码 中 , 桥接 代码 是 vm_execute_java_method()。 它 根据 Java 方 法 调用 惯 
例 准 备 参 数 ， 然 后 调用 到 实际 的 Java 方 法 地 址 中 。 假 设 要 调用 的 Java 方 法 在 p_method HF, & 
数 保存 在 字数 组 p_args_words 中 。Java 方 法 调用 的 返回 值 会 保存 在 双 字数 组 p_ret 中 ， 以 防 
出 现 返回 值 为 double 或 者 long 类 型 的 情况 。 代 码 框架 如 下 所 示 。 
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void vm_execute_java_method( Method* p_method, uint32* 
p_args_words, uint32 *p_ret) 
{ 
// 参数 中 的 字 (word) 数 (不 是 参数 个 数 ， 
// BA long/double 是 两 个 字 ) 
uint32 n_arg_words; 
java_type ret_type; // Java 方法 返回 类 型 
method_get_param_info(p_method, &n_arg_words, &ret_type); 


void* java_entry; // Java 方法 入 口 点 
java_entry = method_get_entry (p_method) ; 


uint32 eax_var, edx_var; // X86 惯例 中 返回 值 
native_to_java_call(java_entry, n_arg_words, p_arg_ 
words, &eax_var, &edx_var); 


// 检查 是 否 有 任何 未 处 理 异 常 


if (thread_get_pending_exception()) return; 
/* SPB wy */ ae 


if ( ret_type == JAVA_TYPE_VOID) return; 
p_ret[0] = eax_var; 
p_ret[1] = edx_var; // RMT long/double 类 型 


} 
native_to_java_call 是 一 段 把 控制 传递 给 Java 方法 的 胶水 代码 。 它 所 做 的 是 在 栈 上 准 
备 参 数 ， 然 后 调用 Java 方 法 。 


void native_to_java_call(void *java_entry, 
uint32 n_arg_words, uint32 *p_args_words, 
uint32 *p_eax_var, uint32 *p_edx_var) 


asm { 
// 压 栈 所 有 参数 
mov n_arg_words -> ecx 
mov p_arg_words -> eax 


loop_more_args: 


or ecx, ecx // 剩 下 的 参数 字数 
jz finished_args // 没有 了 就 break 
push dword ptr [eax] // 压 栈 一 个 字 

dec ecx // 递减 剩余 数量 

add 4 -> eax // 移动 到 下 一 个 参数 字 
jmp loop_more_args // 继续 循环 


finished_args: 
// 所 有 参数 都 在 栈 上 ， 准 备 好 调用 
call adword ptr [meth_addr] 


// 如 果 有 一 个 返回 值 


mov p_eax_var -> ecx 
mov eax -> [ecx] // 保存 eax 到 eax_var 
mov p_edx_var -> ecx 


mov edx -> [ecx] // 保存 edx 到 edx_var 
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这 段 代码 通过 迭代 本 地 代码 传人 的 参数 (pb_args_words ), 以 从 上 到 下 的 方式 压 栈 用 于 Java 
方法 调用 的 参数 。 也 就 是 说 ， 它 首先 压 栈 来 自 本 地 代码 的 第 一 个 参数 ， 由 于 本 地 方法 与 Java 方 
法 调用 惯例 的 方式 不 同 ， 这 实际 上 反 转 了 栈 上 的 参数 顺序 。 需 要 注意 的 另外 一 点 是 ， 静 态 Java 
方法 的 参数 不 包含 类 实例 引用 。 

现在 栈 的 情况 是 对 Java 代码 到 本 地 代码 转换 的 反 转 。 图 7-8 展示 了 这 一 点 。 





调用 Java 方 法 
java_add 之 前 的 栈 


x 





栈 指针 
一 一 一 一 六 







桥接 代码 放 入 的 栈 数据 






调用 callstaticIntMethod() 之 后 的 栈 


JNT 环 境 变量 ， 
图 7-8 本 地 到 Java 转换 的 栈 
从 本 地 代码 到 Java 代码 的 实际 转换 更 加 复杂 ， 涉 及 GC 和 异常 支持 ， 稍 后 会 再 讨论 。 


7.5 本 地 代码 到 本 地 代码 的 转换 


目前 为 止 ， 我 们 只 讨论 了 Java 到 Java, Java 到 本 地 和 本 地 到 Java 的 转换 ， 还 没有 讨论 本 地 
到 本 地 的 情形 。 注 意 这 里 的 本 地 到 本 地 是 指 一 个 〈Java 类 的 ) 本 地 方法 调用 男 一 个 (Java 类 的 ) 
本 地 方法 ， 而 不 是 像 本 地 方法 调用 C 隐 数 这 样 的 本 地 函数 之 间 调 用 的 情形 。 后 者 只 是 传统 的 C 
编程 ， 不 涉及 VM。 对 于 前 者 来 说 ， 有 一 些 有 趣 的 问题 值得 讨论 。 






7.5.1 通过 JNIAPI 的 本 地 到 本 地 转换 


一 个 本 地 方法 可 以 不 通过 JNIAPI 调 用 男 一 个 本 地 方法 。 例 如 ， 在 下 面 的 代码 中 ， 本 地 方法 
native_test1 和 native_test2 以 两 种 方式 调用 男 一 个 本 地 方法 nat ive_add。 一 种 方法 是 
像 C 程 序 一 样 直 接 调 用 本 地 捕 数 ， 男 一 种 方法 是 通过 JNIAPI 调 用 。 

在 Java 代码 Add.java 中: 


public class Add{ 
public static native int testl(int x, int y); 
public static native int test2(int x, int y); 
public static native int add(int x, int y); 
public static int java_add(int x, int y){ 
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return add(x, y); 


在 本 地 代码 Add.c 中 : 


// 本 地 方法 Add.native_add() 
JNIEXPORT jint JNICALL Java_Add_add 
(JNIEnv *jenv, jclass clazz, jint x, jint y) 
{ 
return x+y; 


} 


// 本 地 方法 Add.test1() 
JNIEXPORT jint JNICALL Java_Add_test1 
(JNIEnv *jenv, jclass clazz, jint x, jint y) 





{ 
jint sum = Java_Add_add(jenv, clazz, x, y); 
return sum; 


} 


// 本 地 方法 Add.test2() 
JNIEXPORT jint JNICALL Java_Add_test2 
(JNIEnv *jenv, jclass clazz, jint x, Jint y) 
{ 
jmethodID mid = (*jenv)->GetStaticMethodID(jenv, clazz,"add", "(II)I" ); 
int sum = (*jenv)->CallStaticIntMethod(jenv, clazz, mid, x, 0); 
return sum; 


} 


testl 和 test2 的 代码 结果 相同 ,但 是 对 VM de 在 test1 P, 
Java_Add_add 的 调用 不 经 过 任何 封装 代码 。 从 VM 的 视角 来 看 ， 这 个 调用 是 完全 不 可 见 的 ， 
可 以 被 看 作 内 联 到 了 调用 方 test. 的 内 部 。 


而 在 test2 中 ，callstaticIntMethod() 的 调用 需要 经 过 VM 内 的 两 次 转换 ， 一 次 是 从 
本 地 到 Java， 男 一 次 是 Java 到 本 地 。 


1. 本 地 到 Java 转换 


尽管 add .add() 是 一 个 本 地 方法 , JNI API callstaticIntMethod() 会 把 被 调用 的 方法 看 
作 一 个 Java 方 法 。 这 也 没有 错 ， 因 为 这 里 Java 方 法 指 的 是 这 个 方法 是 在 Java 世界 中 声明 的 ， 并 
以 JNI 惯 例 定义 。 它 不 是 传统 的 本 地 C PR. 


我 们 总 是 应 该 区 分 Java 世界 中 的 “本 地 方法 ”和 CC 世界 中 的 “本 地 函数 ”。 前 者 需要 VM 的 
支持 ， 并 保持 安全 性 。 它 由 JIT 编译 器 “编译 为 封装 代码 "”。 后 者 对 VM 来 说 是 不 可 见 的 , 由 C 
编译 需 编 译 为 二 进 制 码 。 

为 了 从 “本 地 世界 ”转换 到 “Java 世 界 "”，vm_execute_java_method () 用 于 像 为 调用 JIT 编 
译 的 Java 方 法 那样 准备 栈 , 包括 以 Java 惯例 压 栈 参 数 和 接收 返回 值 。vm_execute_java_method 
调用 的 Java 方 法 的 二 进 制 代码 地 址 是 这 个 方法 的 入 口 点 ， 对 于 本 地 方法 来 说 就 是 Java 到 本 地 封 
装 代 码 。 一 旦 它 被 调用 ， 控 制 就 传递 到 了 Java 到 本 地 封装 代码 。 
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2. Java 到 本 地 转换 
一 旦 进入 Java 到 本 地 封装 代码 ， 执 行 就 开始 准备 从 Java 代码 到 本 地 方法 的 调用 。 它 并 不 知 
道 这 个 调用 实际 上 是 由 另 一 个 本 地 方法 发 起 的 。 它 只 知道 调用 来 自 Java 世界 。 栈 应 该 看 起 来 与 
从 aaa.java_adqq() 调 用 的 情况 是 一 样 的 。 
控制 流 如 图 7-9 所 示 。 
本 地 代码 ae a ey 本 地 代码 










‘allStaticInt 
call add 
lethod (add) H 
1 
F 1 return 
i H ret 
i 
1 1 


pS 一 


图 7-9 本 地 方法 到 本 地 方法 的 控制 流 图 
然后 栈 看 起 来 如 图 7-10 所 示 。 


栈 指针 


ae: 
JUNI 环 境 变量 调用 实际 本 地 方法 add 之 前 的 栈 
add% 


Java 到 本 地 
封装 准备 的 
帧 数据 


本 地 到 Java 
桥接 准备 的 
帧 数据 


调用 callstaticIntMethod() 之 后 的 栈 


INI APL% 
的 帧 数据 





图 7-10 本 地 到 本 地 方法 调用 的 栈 数据 
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可 以 看 到 参数 在 栈 上 复制 了 多 次 : 
口 第 一 次 是 在 调用 JNIAPI callStaticIntMethod () WATE; 
口 第 二 次 是 当 本 地 到 Java 桥接 代码 为 Java 方 法 调用 准备 栈 的 时 候 ; 
口 第 三 次 是 Java 到 本 地 封装 代码 为 本 地 方法 调用 准备 栈 的 时 候 。 
根据 实现 细节 的 不 同 , 复制 有 可 能 会 多 于 三 次 。 比 如 , 本 地 到 Java 桥接 代码 可 能 在 执行 Java 
方法 调用 之 前 会 再 次 压 栈 ， 以 便于 添加 接收 (这 个 调用 的 ) 对 象 的 this 指针 。 
如 果 发 生 参 数 再 次 压 栈 ， 参 数 旧 有 的 副本 就 死 掉 了 ， 因 为 方法 调用 只 访问 最 新 压 栈 的 参数 。 


这 意味 着 在 我 们 的 示例 实现 中 , 至少 有 两 组 参数 副本 是 死亡 副本 。 后面 我 们 会 看 到 ,这 一 点 对 于 
GC 来 说 是 至 关 重 要 的 。 


7.5.2 ”为 什么 在 本 地 到 本 地 转换 中 使 用 INI API 


INI API 需 要 经 历 两 次 转换 ， 从 应 用 程序 开发 者 的 角度 来 看 ， 这 似乎 这 是 元 余 的 。 为 什么 不 
直接 调用 本 地 方法 呢 ? 答案 与 Java 的 语义 相关 。 
口 类 初始 化 : 在 调用 类 方法 之 前 ， 为 了 保证 正确 ， 这 个 类 必须 已 经 初始 化 完毕 。JNIAPI 实 
现 中 的 转换 代码 确保 了 这 个 语义 。 
O 类 继承 : 调用 一 个 指定 Java 类 的 方法 时 ， 实 际 的 目标 方法 可 能 是 目标 对 象 中 的 一 个 重 载 
方法 ， 目 标 对 象 的 类 继承 了 指定 类 。JNIAPI 实 现 中 的 转换 代码 通过 查找 实际 目标 方法 保 
W T E Na 
口 待 处 理 异常 : 本 地 代码 执行 可 能 会 引发 需要 处 理 的 异常 。 如 果 不 检查 待 处 理 异常 ， 后 续 
的 本 地 方法 调用 可 能 导致 意料 之 外 的 结 
下 面 的 示例 代码 展示 了 JNI API 实现 中 执行 的 必要 操作 。 它 用 参数 数组 args 调用 目标 对 象 
obj 的 methodID， 并 返回 一 个 对 象 。 
jobject JNICALL CallObjectMethodA(JNIEnv * jni_env, 
jobject obj, 


jmethodID methodID, 
jvalue *args) 


if ( ExeceptionOccurred()) return NULL; 
Method *method = (Method *)methodID; 


// 查找 目标 obj 的 实际 方法 
if (!method_is_private(method)) { 


char* m_name = method->get_name(); 
char* m_desc = method->get_descriptor(); 
method = object_lookup_method(obj, m_name, m_desc); 


} 


// 目标 方法 不 能 是 抽象 的 
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if (method->is_abstract()) { 
ThrowNew (jni_env, clazz_AbstractMethodError, 
"attempt to invoke abstract method"); 
return NULL; 
} 


// 确保 目标 类 已 经 初始 化 

jclass m_class = method->get_class(); 

if (!class_initialize(jni_env, m_class) ) 
return NULL; 


// 添加 this 指针 obj 作为 第 一 个 参数 

unsigned nargs = method->get_num_args(); 

int size_arg = sizeof (jvalue) ; 

int size_nargs = nargs * arg_size; 

jvalue *pargs = (jvalue*)alloca(size_nargs) ; 
pargs[0] = (jvalue) obj; 

memcpy (pargs + 1, args, (nargs - 1) * size_arg); 


// 准备 调用 java 方法 
jobject result; 
jmethodID mid = (jmethodID) method; 


// 维护 GC 安全 性 不 变 
thread_leave_saferegion() ; 
vm_execute_java_method(mid, pargs, &result); 
thread_enter_saferegion(); 


return (jvalue) result; 


} 

这 段 代码 中 , 除了 前 面 提 到 的 几 点 ， 它 还 处 理 了 局 部 对 象 句 柄 ， 稍 后 就 会 介绍 它 。 注 意 另 一 
个 要 点 是 ， 在 Java 方法 执行 的 前 后 ，VM 必须 维护 GC 安全 性 不 变 。 正 如 我 们 之 前 在 线程 对 GC 
的 支持 中 所 讨论 的 ， 这 个 不 变性 要 求 Java 代码 非 安全 ， 但 本 地 代码 安全 。 从 VM 的 角度 看 ， 它 
不 在 乎 目标 方法 本 地 与 否 , 而 是 把 它 看 作 Java 定义 的 方法 , 因此 把 GC 安全 性 状态 从 安全 改 为 非 
安全 。 即 使 目标 方法 是 本 地 的 ， 这 也 不 是 个 问题 ， 因 为 Java 到 本 地 封装 代码 会 处 理 这 个 情况 ， 
第 9 章 中 将 解释 这 一 点 。 

现在 我 们 了 解 了 在 Java 世界 和 本 地 世界 之 间 如 何 来 回调 用 方法 。 这 是 本 地 接口 设计 中 的 代 
人 码 访问 支持 。 目 前 还 没有 介绍 数据 访问 支持 的 方式 ， 例 如 ， 如 何在 本 地 代码 中 创建 和 操纵 Java 
对 象 ， 因 为 这 需要 垃圾 回收 的 支持 ， 这 一 主题 我 们 也 将 在 第 9 章 中 介绍 。 


BSS REH 





栈 展开 (stack unwinding ) 是 指 虚拟 机 枚 举目 标 线程 的 栈 内 容 的 过 程 ， 通 常 涉及 识别 栈 上 方 
法 帧 的 栈 帧 枚 举 过 程 ， 以 及 识别 每 个 方法 帧 内 容 的 栈 槽 枚 举 过 程 。 这 个 过 程 从 栈 顶 开始 ， 因 为 这 
是 当前 栈 指针 指向 的 位 置 。 我们 知道 栈 指针 是 线程 上 下 文 的 一 部 分 , 而 线程 上 下 文 可 以 被 线程 直 
接 访问 。 


8.1 为 何 需要 栈 展 开 
栈 展 开 主 要 有 两 个 应 用 场景 ， 一 个 用 于 控制 流转 移 ， 另 一 个 用 于 栈 内 容 检查 。 
O 控制 流 由 线程 上 下 文 决定 ， 线 程 上 下 文 至 少 包含 栈 指针 和 程序 计数 器 。 要 把 线程 控制 流 
从 一 个 位 置 转 移 到 另 一 个 位 置 ， 应 该 把 线程 上 下 文 内 容 修改 为 指向 新 位 置 。 通 常 ， 这 个 
过 程 从 当前 位 置 弹 出 栈 帧 直到 到 达 目 标 栈 帧 ， 而 且 不 保存 弹出 栈 帧 的 数据 ， 因 此 被 称 为 
破坏 性 栈 展开 。 
O 栈 展开 也 可 以 用 于 枚 举 栈 上 数据 ， 而 且 不 改变 线程 上 下 文 内 容 。 这 个 应 用 场景 也 称 为 
栈 遍 历 或 者 逻辑 栈 展开 ， 是 非 破坏 性 的 。 根 据 不 同 的 需求 ， 栈 展开 也 可 能 有 其 他 使 用 
场景 。 
异常 处 理 需要 栈 展开 。 它 需要 运行 时 递归 地 展开 栈 帧 ， 直 到 在 某 个 方法 内 找到 catch 块 (也 
就 是 异常 处 理 器 )， 和 否则 它 就 是 未 捕获 异常 ， 可 能 需要 操作 系统 来 处 理 。 然 后 控制 流 从 异常 抛 出 
点 转移 到 异常 处 理 点 。 如 果 异 常 处 理 和 异常 抛 出 不 在 同一 个 方法 中 的 话 , 异常 处 理会 挫 毁 位 于 异 
第 处 理 器 方法 之 上 的 栈 帧 。 无 论 异 常 处 理 是 否 在 同一 个 方法 中 , 都 需要 展开 整个 栈 来 输出 异常 的 
栈 轨迹 。 其 他 编程 语言 也 有 类 似 的 控制 流转 移 用 例 ， 比 如 C 语言 中 的 setjmp 和 longjmp， 以 
及 Scheme 语言 中 的 continuation. 
对 象 追 踪 垃 圾 回收 需 需 要 通过 栈 展开 找到 运行 时 栈 的 根 引 用 。 调试 器 需要 通过 栈 展开 检查 栈 
内 容 。 有 些 性 能 分 析 工 具 也 需要 利用 栈 展开 技术 识别 运行 中 的 方法 ， 以 确定 执行 热点 。 
方法 调用 的 返回 也 可 以 被 看 作 栈 展开 的 一 种 特殊 情况 , 它 展开 一 个 帧 并 把 控制 从 被 调用 方 转 
移 到 调用 方 。 但 通常 不 把 这 称 为 栈 展开 。 栈 展开 通常 是 指 运 行 时 服务 , 但 函数 返回 通常 不 涉及 运 
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行 时 ， 而 是 返回 指令 的 硬件 功能 。 
为 了 支 持 栈 展 开 ， 栈 帧 的 构造 方式 需要 满足 以 下 两 个 要 求 。 


O 栈 帧 通过 反 向 指针 链接 起 来 ， 这 样 运行 时 可 以 通过 追踪 这 个 指针 链 找到 每 个 栈 帧 。 这 个 
指针 称 为 帧 指针 ( frame-pointer ) 。 

O 栈 槽 信息 需要 记录 ， 这 样 运行 时 能 够 知晓 如 何 枚 举 这 些 槽 位 。 只 有 运行 时 需要 枚 举 栈 内 
容 时 才 需 要 这 一 条 。 

本 章 接 下 来 的 部 分 将 介绍 如 何 支持 Java 方 法 帧 和 本 地 方法 帧 的 栈 展 开 。 


8.2 ”Java 方 法 帧 的 栈 展开 


在 JVM 的 实现 中 ， 即 时 (JIT ) 编译 器 决定 了 把 Java 方 法 帧 链接 到 一 起 的 方式 。 这 与 本 地 编 
Pear Ay TEKMI o 


8.2.1 栈 展开 设计 
一 个 常用 实现 是 通过 帧 指针 形成 帧 链 ， 如 图 8-1 所 示 。 





bar () 的 帧 






foo () 的 帧 











帧 指针 
返回 PC 


栈 增长 方向 


图 8-1 带 帧 指针 链 的 栈 帧 


链 中 的 帧 指针 以 当前 帧 指针 为 起 点 ,当前 帧 指针 指向 的 栈 槽 中 存储 指向 前 一 帧 的 帧 指针 , 然 
后 前 一 帧 以 递归 的 方式 指向 它 的 前 一 帧 ,直到 栈 底 ,那里 的 帧 指针 槽 位 内 容 为 NULL。 当 前 帧 指 
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针 可 以 是 一 个 专用 寄存 器 (比如 X86 中 的 ebp )， 也 可 以 保存 在 线程 局 部 存储 (TLS ) 中 的 一 个 
变量 中 。 这 是 线程 上 下 文 的 一 个 新 增 内 容 。 


构造 这 样 的 帧 指针 链 很 简单 。JIT 编译 器 只 需要 生成 以 下 两 条 指令 作为 方法 最 开始 的 指令 : 


push frame_pointer 
move stack_pointer -> frame_pointer 


TE X86 ISA 中 ， 它 们 会 转化 为 以 下 两 条 指令 : 


push ebp 
move esp -> ebp 


因为 这 是 一 个 方法 最 开始 的 两 条 指令 , 在 它们 之 前 , 最 后 执行 的 一 条 指令 是 调用 当前 方法 的 
call 指令 。 这 时 候 ， 栈 指针 (也 就 是 X86 中 的 esp) 指向 的 当前 栈 顶 槽 位 是 返回 PC ( 也 就 是 
X86 中 的 eip )。 返 回 PC 指向 调用 者 代码 中 call 指令 的 下 一 条 指令 。 当 前 帧 指针 (也 就 是 X86 
中 的 ebp ) 指向 调用 方 帧 。 

对 于 下 面 的 代码 序列 , 在 call bar 执行 之 后 ，bar 方法 执行 之 前 ， 程 序 计数 器 状态 如 图 8-2 
所 示 。 


foo(): 










LF spr 
call bar 


hes ar 


push ebp 


move esp->ebp 


返回 PC hlass 





图 8-2 执行 call bar 指令 后 的 状态 快照 
此 刻 (PUT call bar 之 后 ) 的 栈 数 据 如 图 8-3 所 示 。 注 意 栈 指针 和 帧 指针 。 


foo 帆 





图 8-3 执行 call bar 指令 后 的 栈 
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执行 bar 方法 最 开始 的 两 条 指令 之 后 ， 栈 如 图 8-4 所 示 。 栈 指针 和 帧 指针 指向 同一 个 槽 位 ， 
其 中 存储 了 旧 的 帧 指针 值 。 这 样 就 形成 了 帧 指针 链 。 


帧 指针 





nee 


帧 指针 
返回 PC 


图 8-4 执行 bar 方法 最 开始 的 两 条 指令 后 的 帧 
为 了 正确 维护 帧 指针 链 ， 在 方法 的 尾部 ， 方 法 返回 需要 执行 下 面 的 指令 : 


pop frame_pointer 








return 

以 上 代码 等 价 于 下 面 的 指令 : 

mov (*frame_pointer) -> frame_pointer 
pop // 弹出 旧 的 frame_pointer 
return 

在 X861ISA 中 ,相当 于 如 下 指令 : 

pop ebp 

ret 


或 者 换 一 种 形式 : 


mov [ebp] -> ebp 
ret 4 


通过 这 种 方式 ， 方 法 返回 的 时 候 ， 帧 指针 寄存 器 指向 了 调用 方 栈 帧 。 


8.2.2 ERAKI 


假定 帧 上 下 文 数据 结构 持 有 3 个 寄存 器 值 ， 即 帧 指针 、 栈 指针 和 指令 指针 , 那么 栈 展 开 过 程 
就 如 以 下 代码 所 示 : 
struct Frame_context { 
uint32 ebp; 
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uint32 esp; 
uint32 eip 
} 


void unwind_stack(VM_Thread* thread) 
{ 
Frame_context* frame = start_frame (thread); 
while( frame->ebp != NULL) { 
// 找到 当前 帧 的 方法 
uint32 eip = frame->eip; 
Method* method = method_of_pc(eip) ; 
// 方法 操作 


/7 找到 前 一 帧 内 容 


frame = find preceding frame (frame); 
} 


// 展开 到 给 定 帧 的 前 一 帧 
Frame_context* find_preceding_frame(Frame_context* frame) 
{ 

frame->eip = frame->ebp - 4; 

frame->esp = frame->ebp - 8; 

// 同 mov [ebp] -> ebp 

frame->ebp = *(uint32*) frame->ebp; 





} 


一 个 VM 实现 可 能 有 多 个 JIT 编译 器 ， 或 者 有 带 多 级 优化 的 单个 JIT 编译 占 。 其 中 每 一 个 都 
可 能 采用 不 同 的 栈 帧 组 织 方式 .只 有 编译 这 个 方法 的 JIT 编 译 器 确切 了 解 它 的 栈 帧 是 如 何 组 织 的 
栈 展开 模块 的 设计 需要 确定 每 帧 的 JIT 编译 器 ， 然 后 把 展开 过 程 委托 给 这 个 JIT 编译 骨 。 伪 代 码 
如 下 所 示 ， 其 中 为 每 个 编译 单元 ， 比 如 一 个 方法 ， 维 护 一 个 JIT_info 数据 结构 的 实例 。VM 可 
以 为 任何 生成 代码 的 地 址 取得 一 个 JIT_info 实例 。 可 以 通过 这 个 JIT_info 实例 得 到 所 有 的 
编译 相关 信息 。 


struct JIT_infof{ 
JIT* jit; 
Method* method; 
void* code_addr; 
int code_size; 

} 


void unwind_stack(VM_Thread* thread) { 

Frame_context* frame = start_frame(thread) ; 
while( frame->ebp != NULL ) { 

uint32 eip = frame->eip; 

JIT_info* info = info_of_pc(eip); 

// 找到 当前 帧 的 方法 

Method* method = info->method; 

// 对 方法 进行 操作 


// 找到 前 一 帧 内 容 
JIT* Jit = Anfe-S7wes 
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frame = jit find preceding frame (jit, frame); 
} 
} 


函数 jit_find_preceding_frame () 使 用 编译 这 个 方法 的 JIT 来 展开 它 的 帧 。 


8.3 本 地 方法 帧 的 栈 展开 

如 果 运 行 时 栈 有 本 地 方法 帧 ， 那 么 栈 展 开 就 会 复杂 许多 ， 因 为 本 地 方法 由 本 地 编译 器 编译 ， 
它 的 栈 帧 链 对 于 JVM 来 说 是 未 知 的 。 这 种 情况 下 ， 和 运行 时 无 法 直接 展开 本 地 帧 ， 但 它 可 以 处 理 
经 由 封装 调用 的 本 地 方法 ， 从 而 利用 本 地 方法 的 封装 代码 绕 过 这 个 问题 。 


8.3.1 栈 展开 设计 


前 面 已 经 介绍 过 ,从 Java 代码 调用 或 通过 INI API 调用 的 本 地 方法 被 认为 是 Java 世界 的 一 个 
特殊 部 分 。 它 们 通过 封装 函数 调用 。 这 不 同 于 把 本 地 方法 作为 C 函数 直接 调用 。 有 了 封装 代码 ， 
VM 就 有 机 会 构造 帧 指针 链 ， 如 图 8-5 所 示 。 


帧 指针 a 
Java 
H 1 


ed Le pea gph 
in 本 地 方法 C 


Ay 和 本 地 方法 B 


I 






帧 指针 链 


图 8-5 包含 本 地 方法 帧 的 栈 帧 链 
图 8-5 中 ， 本 地 方法 A 由 Java 代码 调用 ， 而 本 地 方法 B 和 本 地 方法 C 被 直接 调用 ， 它 们 实 
际 上 应 称 为 本 地 函数 ， 而 不 是 本 地 方法 ， 因 为 它们 的 调用 没有 通过 JNI API。 在 这 个 设计 中 , 本 
地 方法 A、 本 地 方法 B 和 本 地 方法 C 的 帧 被 认为 是 单个 帧 ， 属 于 本 地 方法 A。 本 地 方法 B 和 本 
地 方法 C 被 认为 是 本 地 方法 A HY ABE PRR 
尽管 从 VM 的 角度 来 看 ， 本 地 方法 B 和 本 地 方法 C 在 栈 上 没有 属于 自己 的 帧 ， 但 从 本 地 代 
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码 的 角度 来 看 , 它们 确实 有 自己 的 帧 。 只 不 过 它们 的 本 地 帧 对 于 VM 是 不 可 见 的 , 而 且 VM 也 会 
忽略 其 中 由 本 地 编译 带 构 造 的 本 地 帧 指针 链 。 


在 实际 的 实现 中 ,构造 这 样 的 帧 指针 链 是 很 复杂 的 。 其 原因 是 ，Java 代码 (也 就 是 JIT 编译 
的 代码 ) 用 专用 寄存 器 保存 帧 指针 ,本 地 函数 不 能 很 好 维护 它 的 值 , 因为 本 地 编译 器 不 必然 遵循 
Java 帧 的 惯例 。 

不 过 ， 不 必 使 用 单个 帧 指针 链 维护 栈 帧 。 一 种 思路 是 使 用 两 级 链接 。 

一 个 链 在 一 簇 连 续 的 Java 帧 内 部 ， 是 它们 原来 的 Java 帧 指针 链 。Java Wii (frame cluster ) 是 
指 两 个 本 地 帧 之 间 ， 或 者 栈 底 与 第 一 个 本 地 帧 之 间 ， 或 者 最 后 一 个 本 地 帧 与 栈 顶 之 间 的 连续 Java 
帧 。 在 一 个 Java 帧 内 部 ， 即 原来 的 普通 Java 帧 的 栈 指针 链 , 在 到 达 一 个 本 地 方法 或 者 栈 底 时 断裂 。 

另 一 级 帧 指针 链接 Java Wiik, 如 图 8-6 所 示 。 我 们 把 这 一 级 帧 指针 称 为 “ 簇 指针 ”。 通 过 这 种 
方法 ，VM 总 可 以 通过 艇 指针 找到 下 一 个 Java tiie, SAID Java 帧 指针 找到 簇 内 的 每 个 Java 帧 。 


—_ 


地 帧 


shy 


本 地 帧 
Suh 
1 ;本 地 帧 ，， 
`l Ahe 


EE SE 
Javai 
Javai 
Bae ate 


ee 





图 8-6 Java 艇 指针 链 
Java 徐 指 针 链 从 当前 “ 簇 指针 ”开始 ， 它 有 如 下 两 点 用 处 。 
O 它 指向 一 个 栈 槽 ， 该 栈 槽 包含 指向 下 一 个 Java We TTT o 
口 它 指 向 的 栈 覃 到 当前 Java 帧 复 的 顶层 Java 方法 帧 有 固定 的 俩 移 量 。 
这 与 普通 帧 指针 的 概念 是 一 样 的 ， 运 行 时 可 以 通过 它 找到 当前 帧 的 第 一 个 槽 位 以 及 下 一 帧 。 
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8.3.2 Java 到 本 地 封装 设计 


为 了 支持 这 个 设计 ，Java 到 本 地 封装 代码 需要 维护 两 个 指针 ,一 个 是 帧 指针 ， 另 一 个 是 艇 指 
针 。 当 前 帧 指针 通常 保存 在 专用 寄存 器 中 ( 比如 X86 ISA 中 的 epp )， 而 簇 指针 没有 这 样 内 置 的 
寄存 器 。 更 重要 的 是 ， 本 地 方法 不 应 该 触 碰 簇 指 针 ， 如 果 放 在 寄存 器 中 就 难以 实现 这 一 点 。 因 为 
运行 时 栈 是 线程 专 有 数据 结构 ， 所 以 一 个 很 自然 的 设计 就 是 在 TLS 中 用 一 个 线程 局 部 变量 来 保 
TFIIF 


使 用 这 个 设计 ， 应 该 把 下 面 的 代码 段 插入 到 Java 到 本 地 封装 代码 中 ， 就 放 在 帧 指针 链 建 立 
起 来 之 后 : 

// 得 到 线程 局 部 簇 指针 地 址 

p_cluster_pointer = get_address_of_cluster_pointer(); 

// 当前 旋 指 针 压 栈 ， 构 造 链 

push *p_cluster_pointer; 

// 用 栈 指 针 更 新 当前 旋 指 针 

*p_cluster_pointer = stack_pointer; 


用 X86 指令 表示 为 如 下 代码 : 


// 调用 结果 在 eax 中 ，eax = p_cluster_pointer 
call get_address_of_cluster_pointer 

push [eax] 

mov esp -> [eax] 


经 过 这 个 操作 之 后 ， 栈 就 会 如 图 8-7 所 示 。 从 簇 指针 指向 的 位 置 开 始 ，VM 可 以 找到 Java fe 
中 的 第 一 个 Java 帧 。 从 第 一 个 Java 帧 开始 ， 这 个 簇 中 其 余 的 Java 帧 都 可 以 被 枚 举 到 ， 直 到 到 达 
一 个 本 地 帧 或 栈 底 。( 要 确定 一 个 帧 是 Java 帧 还 是 本 地 帧 ，VM 可 用 的 一 种 方法 是 检查 这 个 帧 的 
执行 代码 段 是 否 由 JIT 编译 。) 


族 指 针 Java 到 本 地 封装 





帧 指针 T 


Javai 
Pela et HE 


图 8-7 Java 到 本 地 转换 中 保存 的 簇 指针 
控制 流 返 回 到 Java 代码 的 时 候 ， 在 返回 之 前 需要 执行 下 面 的 代码 。 
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// 得 到 线程 局 部 散 指 针 的 地 址 

p_cluster_pointer = get_address_of_cluster_pointer(); 
// Th RAW RET 

pop cluster_pointer 

// 恢复 线程 局 部 给 指针 

*p_cluster_pointer = cluster_pointer; 


用 X86 指令 表示 为 如 下 代码 : 


// 调用 结果 在 eax 中 ; eax = p_cluster_pointer 
call get_address_of_cluster_pointer 
pop ecx // 弹出 保存 的 散 指 针 到 ecx 中 


mov ecx -> [eax] 

在 实际 实现 中 ， 可 以 把 线程 局 部 簇 指针 的 地 址 保存 在 栈 上 ， 这 样 可 以 在 控制 返回 到 Java 代 
码 时 省 去 这 个 函数 调用 。 

有 了 Java 徐 指针 后 ， 就 应 该 修改 前 面 的 Java 到 本 地 转换 示例 封装 代码 ， 把 簇 指针 维护 操作 
包含 进去 。 注 意 这 段 代 码 在 帧 指针 和 簇 指 针 之 间 还 压 栈 了 额外 一 些 数据 ， 如 图 8-8 所 示 。 











禾 指 针 
i 







Java 到 本 地 封装 






Javalhini 





图 8-8 ”修改 后 支持 栈 展开 的 封装 代码 的 栈 帧 


// 首先 保存 被 调用 方 保存 寄存 器 
push ebp 
push ebx 
push esi 
push edi 


// 调用 结果 在 eax 中, eax = p_cluster_pointer 
call get address of cluster_pointer 

// 保存 地 址 ， 返 回 时 不 需要 调用 上 面 的 函数 

push eax 

// 保存 Sava AGH Y 4 ATA 

push [eax] 

// 更 新 Java 旋 指 针 ， 指 向 当前 位 置 


mov esp -> [eax] 
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// 压 栈 本 地 方法 参数 


push [esp+28] // ARY 

push [esp+36] // ARX 

push addr_class_Add // AR Add 类 实例 
push addr_JNI_Env // AR INI 环境 变量 





// 调用 实际 本 地 方法 实现 

call Java_Add_native_ladd 
// 恢复 Java ASH 

// 得 到 Java RAHA iii 
pop ecx 

// 得 到 Java HASH HHL 

pop ebx 

// 恢复 前 一 个 Java RASH 


mov ecx -> [ebx] 


// 恢复 被 调用 方 保存 寄存 器 
pop edi 

pop esi 

pop ebx 

pop ebp 

// 返回 并 弹出 Java 参数 (X，Y) 
ret 8 


其 中 的 加 粗 代 码 体 为 我 们 新 加 入 的 用 于 栈 展开 支持 的 修改 。 


8.3.3 RAKHA 


为 了 简化 代码 ， 我 们 可 以 把 用 于 Java 到 本 地 转换 的 保存 数据 组 合成 一 个 数据 结构 ， 名 为 
M2N_wrapper， 表 示 managed-to-native ( 托管 到 本 地 ) 转换 数据 。 它 的 元 素 是 图 8-8 中 栈 条 目的 
1 : 1 映射。 
struct M2N_wrapper { 

M2N_wrapper *jcp; 

M2N_wrapper **addr_jcp; 

uint32 edi; 

uint32 esi; 

uint32 ebx; 

uint32 ebp; 


uint32 eip; 
} 


有 了 这 个 数据 结构 ，VM 可 以 通过 簇 指针 jcp 访问 M2N_wrapper 中 的 栈 条 目 。 


现在 需要 调整 栈 展 开 过 程 ， 把 得 指针 逻辑 包含 进去 ， 如 以 下 伪 代 码 所 示 。 注 意 在 现实 中 , 运 
行 时 栈 总 是 有 本 地 帧 与 Java 帧 的 混合 , 因为 不 管 怎样 , Javamain () 方 法 都 是 由 本 地 代码 调用 的 。 
因此 , 通过 检查 ebp==NULL 确定 栈 底 并 不 是 最 好 的 方法 ,因为 在 Java BREE ebp X NULL 的 可 能 
性 不 大 。 不 过 VM 可 以 检查 Java 簇 指 针 是 否 为 NULL， 也 就 是 当前 Java 簇 之 下 是 否 不 再 有 Java 
Wi, VM 实例 最 初 加 载 的 时 候 ，Java PASE RIA NULL. 


struct Frame_context { 
uint32 ebp; 
uint32 esp; 
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uint32 eip; 
M2N_wrapper* jcp; // java 族 指 针 ; 
} 


void unwind_stack(VM_Thread* thread) 

{ 
Frame_context* frame = start_frame (thread); 
Code_Type type = code_type(frame->eip) ; 


// Tava MRRK 
Do { 
// Tava PAA SPieK 
while( type == CODE_TYPE_JAVA ) { 
Method* method = method_of_pc(frame->eip) ; 
// 方法 的 操作 


// 找到 之 前 的 帧 内 容 

uint32 ebp frame->ebp; 
frame->eip ebp - 4; 
frame->esp = ebp - 8; 

ebp = *(uint32*)ebp; 
frame->ebp = ebp; 

type = code_type(frame->eip); 


1 Wo y 


} 

// eip 指向 本 地 代码 

// 跳 过 本 地 帧 到 达 下 一 个 java & 

M2N_wrapper* jcp = frame->jcp; 

int wrapper_size = sizeof (M2N_wrapper) ; 

if (Jep != NULL) { 
// 得 到 这 个 族 内 第 一 个 Java th 
frame->ebp = jcp->ebp; 
frame->eip = jcp->eip; 
frame->esp = jcp - wrapper_size; 
jcp = jcp->jcp; 
frame->jcp = jcp; 
type = code_type(frame->eip) ; 

} 

}while( type == CODE_TYPE_JAVA) 


} 

以 上 设计 在 支持 运行 时 栈 展 开 的 同时 ， 也 支持 了 Java 与 本 地 之 间 的 快速 控制 流转 换 。 慢 一 
点 的 设计 可 以 把 运行 时 栈 帧 的 元 数据 保存 在 一 个 TLS 中 ,组 织 为 一 个 影子 栈 数据 结构 。 每 次 控 
制 流 与 本 地 代码 来 回转 化 的 时 候 ，VM 可 以 把 本 地 帧 元 数据 压 人 影子 栈 中 ,或 者 从 影子 栈 弹出 本 
地 帧 元 数据 ， 以 此 维护 这 个 信息 与 执行 状态 一 致 。 使 用 这 种 方法 ， 可 以 通过 从 TLS 中 获取 元 数 
据 来 支持 本 地 帧 栈 展 开 。 


8.3.4 本 地 帧 与 C bi 
前 面 已 经 提 到 ， 有 时 候 会 出 现 本 地 方法 通过 JNIAPI 调 用 另 一 个 本 地 方法 的 情况 ， 这 会 经 历 
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两 次 转换 : 第 一 次 是 从 本 地 到 Java， 第 二 次 是 从 Java 到 本 地 。 第 一 次 转换 (在 vm_execute_ 
java_method() 中 ) 准备 栈 用 来 在 当前 本 地 帧 之 上 调用 一 个 Java 方法。 第 二 次 转换 ( 在 Java 到 
本 地 封装 中 ) 不 知道 这 实际 上 是 来 自 本 地 方法 的 调用 ， 因 为 栈 看 起 来 就 像 是 来 自 Java 世界 的 调 
FA, Java 到 本 地 封装 还 会 维护 Java FEIE HE, DURATION WE Java 帧 一 样 。 

为 了 区 分 本 地 方法 帧 与 传统 C RKR, 我们 用 本 地 帧 表示 本 地 方法 的 帧 ,传统 函数 则 用 C 
帧 表示 。 一 个 C 帧 可 以 属于 一 个 本 地 方法 , 但 这 个 方法 是 不 经 过 INI API 直接 从 本 地 代码 调用 的 。 

所 有 本 地 帧 通过 Java 簇 指针 链接 在 一 起 , 即便 两 个 相 邻 本 地 帧 中 间 没 有 Java 帧 徐 也 是 如 此 ， 
如 图 8-9 所 示 。 
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Fel 8-9 带 有 相 邻 本 地 帧 与 C 帧 的 栈 


栈 展 开 过 程 中 ， 本 地 到 本 地 帧 不 需要 特殊 处 理 。 如 果 一 个 本 地 帧 前 面 是 另 一 个 本 地 帧 的 话 ， 
返回 代码 地 址 ( eip ) 不 属于 Java 方 法 代码 , 因此 VM 就 可 以 知道 前 一 个 帧 仍然 是 本 地 帧 。 于 是 ， 
栈 展开 例 程 就 可 以 直接 通过 加 载 下 一 个 Java 徐 指针 来 展开 下 一 个 本 地 帧 。 


有 了 栈 展开 支持 ， 就 可 以 设计 根 集 枚 举 和 腊 常 抛 出 。 接 下 来 的 章节 中 会 介绍 这 些 主题 。 


PIFS ADNOWSA 





前 面 的 章节 中 已 经 介绍 了 垃圾 回收 ( GC ) 算 法 和 GC 安全 点 的 概念 ,本 章 将 介绍 虚拟 机 ( VM ) 
为 垃圾 回收 所 提供 的 支持 。 


9.1 为何 需 要 垃圾 回收 支持 


在 Java 代码 中 支持 GC， 主 要 任务 是 让 JIT 编译 器 生成 安全 点 。 安 全 点 可 能 包含 以 下 位 置 。 
它们 可 能 触发 回收 、 阻 塞 线程 执行 ,或 者 导致 线程 长 时 间 执 行 。 每 个 安全 点 都 需要 一 个 GC-map 
数据 结构 文 持 根 集 枚 举 ， 其 中 存储 执行 上 下 文中 哪些 位 置 包含 引用 的 相关 信息 。 

(1) 对 象 分 配点 : 这 是 可 能 创建 一 个 新 对 象 的 指令 ， 比 如 字 节 码 new 和 newarray。 如 果 空 
亲 堆 空间 放 不 下 这 个 新 对 象 ， 就 会 触发 垃圾 回收 。 通 常 这 是 触发 垃圾 回收 的 唯一 位 置 。 
这 个 位 置 的 GC-map 是 必需 的 。 另 一 方面 ， 当 一 个 修改 器 分 配 一 个 对 象 的 时 候 ， 另 一 个 
修改 器 可 能 会 触发 一 次 回收 。 第 一 个 修改 吉 被 阻塞 ， 等 待 回收 结束 ， 然 后 它 就 能 分 配 一 
个 新 对 象 。 这 种 情况 下 ， 这 个 位 置 的 GC-map 也 是 必需 的 ， 这 样 才 能 够 在 这 个 位 置 执行 
根 集 枚 举 。 

(2) 调用 点 : 这 是 调用 Java 或 本 地 方法 的 指令 ， 比 如 那些 invoke 系列 字 节 码 。 回 收发 生 的 
时 候 ， 运 行 时 栈 上 的 所 有 方法 帧 除了 顶层 帧 都 是 调用 点 ， 所 以 调用 点 应 该 有 GC-map 信 
息 。 男 一 方面 ， 这 些 方法 可 能 形成 长 时 间 运 行 的 递归 调用 循环 。 因 此 ， 调 用 点 应 该 能 够 
通过 GC 轮 询 代 码 响应 其 他 线程 触发 的 回收 请 求 ， 这 一 点 很 重要 。 

(3) 阻塞 点 : 这 是 可 能 阻塞 线程 执行 未 知 时 长 的 指令 ， 比 如 monitorenter。 这 个 位 置 应 该 
有 GC-map 信息 ， 这 样 回收 可 以 在 当前 线程 被 阻塞 的 时 候 继 续 进行 。 

(4) 循环 中 : 可 以 是 循环 中 的 任意 位 置 ， 一 般 是 在 回 边 上 。 未 包含 前 面 提 到 的 几 点 的 循环 可 
能 会 运行 很 长 时 间 ， 并 无 法 响应 回收 请 求 。 最 好 在 循环 中 插入 GC 轮 询 代 码 ， 这 样 它 可 
以 查询 回收 请 求 ， 如 果 有 待 处 理 请 求 的 话 就 暂停 自身 。 轮 询 点 应 该 有 GC-map， 以 此 支 
持 线程 在 轮 询 点 上 和 暂停 时 的 回收 。 

(5) 异常 抛 出 点 : 在 Jaa H, 许多 异常 抛 出 点 不 需要 是 安全 点 ， 因 为 异常 对 象 已 经 为 显 式 异常 
抛 出 而 创建 ， 抛 出 过 程 是 一 个 快速 完成 的 VM 服务 。 但 下 面 的 情况 是 需要 GC-map 的 。 
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O 对 于 通过 硬件 异常 处 理 毅 数 捕获 的 隐 式 异常 来 说 ， 处 理 明 数 可 能 需要 为 异常 对 象 及 栈 轨 
迹 等 创建 一 些 对 象 ， 这 可 能 引起 垃圾 回收 。 

口 有 时 候 ， 异 常 抛 出 也 被 用 作 控 制 流 操纵 的 一 部 分 。 尽 管 不 太 可 能 长 时 间 执 行 而 不 包含 上 
面 提 到 的 几 点 ,但 如 果 有 些 异常 抛 出 点 有 GC 轮 询 代码 可 能 也 是 有 所 帮助 的 。 

O 如 果 蜡 常 抛 出 需要 在 异常 抛 出 上 下 文 之 上 执行 额外 的 代码 ， 这 就 像 是 调用 进入 了 额外 的 
代码 。 这 个 额外 代码 可 能 没有 前 面 提 到 的 点 ， 所 以 需要 为 异常 抛 出 点 建立 GC-map。 例 
如 ， 异 常 抛 出 过 程 中 的 对 象 创 建 通常 会 涉及 对 象 构 造 器 执行 。 另 一 个 例子 (不 是 Java) 
是 Microso 人 结构 化 异常 处 理 中 的 过 滤 需 表达 式 。 

在 以 上 的 GC 安全 点 列表 中 ,前 两 点 (对象 分 配点 与 调用 点 ) 是 强制 性 的 ， 因 为 对 象 分 配 时 

可 能 发 生 GC， 而 调用 点 是 那些 GC 发 生 时 栈 上 的 点 。 


接 下 来 的 两 点 (阻塞 点 和 循环 回 边 ) 看 起 来 是 为 了 优化 而 设置 的 , 也 就 是 说 ,是 为 了 限定 回 
收 请 求 的 响应 速度 。 但 对 于 某 些 应 用 程序 来 说 ,为 了 让 应 用 程序 继续 前 进 ,这 些 点 是 必需 的 。 例 
an, 持 有 一 个 monitor 的 线程 触发 了 回收 ， 同 时 另 一 个 线程 在 阻塞 等 待 这 个 monitor。 如 果 阻 塞 线 
程 不 允许 回收 继续 ， 那 么 触发 回收 的 线程 就 永远 无 法 释放 这 个 monitor。 但 这 种 情况 极 少 发 生 ， 
所 以 也 存在 不 支持 这 两 类 GC 安全 点 的 VM 实现 。 

最 后 一 点 (异常 抛 出 点 ) 有 点 类 似 于 调用 点 。 

应 该 为 所 有 GC 安全 点 建立 GC-map。 当 回收 发 生 时 ， 这 些 点 可 能 在 栈 上 。 还 需要 在 调用 点 
和 循环 回 边 插入 GC 轮 询 代 码 ， 以 打 断 长 时 间 执 行 。 

在 实际 实现 中 ， 对 象 分 配 和 阻塞 操作 被 实现 为 对 VM 内 存 管理 和 线程 管理 服务 代码 的 调用 ， 
所 以 也 可 以 归 为 调用 点 这 一 类 。 出 于 这 种 考虑 ， 也 可 以 说 GC 安全 点 只 包含 调用 点 ， 有 时 候 还 包 
含 循环 回 边 。 

当 GC 被 触发 时 ， 所 有 线程 都 暂停 在 安全 点 上 ,它们 的 执行 状态 保存 在 各 自 的 线程 局 部 存储 
中 。 然 后 VM ( 基于 保存 的 执行 状态 ) 遍历 每 个 线程 的 线程 专 有 数据 和 全 局 数据 来 找到 根 集 。 线 
程 专 有 数据 包括 运行 时 栈 、 寄 存 右 文件 和 线程 局 部 存储 。 全 局 数据 包括 加 载 的 类 、 驻 留 字 符 串 
( interned string ) 和 全 局 引用 。 下 面 这 段 伪 代码 在 第 $ 章 中 已 经 给 出 过 。 


void stop_the world-root_set_enumeration() 
{ 

vm_suspend_all_threads() ; 

for ( each thread thr ) { 

vm_enumerate_root_in_thread( thr ); 

} 

vm_enumerate_root_in_globals(); // 在 全 局 数据 中 
} 


Xf AE TA EA BC EEL PAS. PREI AAAS Bett CE AEE PR BB, 
void vm_enumerate_root_in_thread(VM_Thread* thread) 


{ 


Frame_context *frame = start_frame(thread) ; 
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while(!is_stack_bottom(frame) ) { 
Code_Type type = code_type(frame) ; 
if( type == CODE_TYPE_JAVA) { 
java enumerate root set (frame); 
jelse{ // 本 地 代码 
native enumerate root set (frame) 
} 


/** 
这 里 VM 可 以 把 活跃 方法 的 声明 类 的 类 加 载 器 
放 在 根 引 用 中 


大 炎 / 


frame = preceding_frame(frame) ; 
} 
} 


Java 代码 的 根 集 枚 举 由 JIT 编译 器 〈 或 解释 器 ) 执行 ， 本 地 代码 的 根 集 枚 举 则 由 VM 执行 。 


9.2 在 Java 代码 中 支持 垃圾 回收 


为 了 枚 举 Java 方法 的 根 集 ，JIT 编译 器 为 它 所 编译 方法 的 每 个 安全 点 都 创建 了 一 个 GC-map 
数据 结构 。 同 时 ， 帧 上 下 文 也 支持 栈 展开 中 的 寄存 器 枚 举 。 


9.2.1 GC-map 

每 个 安全 点 上 有 一 个 GC-map 为 局 部 变量 、 操 作 数 栈 和 寄存 器 文件 记录 位 图 。 每 一 位 代表 一 
个 变量 、 一 个 栈 槽 位 或 一 个 寄存 器 。 如 果 某 一 项 中 有 引用 ， 对 应 的 位 就 设置 为 1， 否 则 为 0。 通 
常生 成 GC-map 有 3 种 方法 : 运行 时 更 新 、 编 译 时 生成 ， 以 及 惰性 ( lazy ) 生成 。 

1. 运行 时 更 新 

可 以 在 运行 时 动态 维护 GC-map， 方 式 是 每 个 保存 到 变量 、 栈 帧 或 寄存 器 的 引用 都 更 新 相应 
的 位 。 向 原来 包含 非 引用 的 条 目 保存 一 个 引用 意味 着 置 起 这 一 位 ， 而 把 非 引 用 保存 到 一 个 引用 醒 
位 意味 着 重 置 这 一 位 。 

这 实现 起 来 很 简单 ， 可 能 适用 于 解释 器 ， 但 它 会 导致 过 高 的 运行 时 开销 ， 所 以 JIT 对 这 种 方 
式 没有 兴趣 。 

2. 编译 时 生成 

运行 时 更 新 这 种 方法 不 会 提前 为 每 个 安全 点 生成 GC-map， 而 是 为 正在 执行 的 方法 动态 维护 
运行 时 GC-map。 相 比 之 下 ,JIT 可 以 在 Java 代码 运行 之 前 通过 数据 流 分 析 推 导出 GC-map 结果 。 
它 只 需要 在 编译 时 为 每 个 安全 点 生成 一 次 GC-map 即 可 。 

为 了 识别 栈 上 和 变量 中 的 引用 , 通常 需要 两 轮 分 析 。 一 轮 是 向 前 传播 变量 的 类 型 信息 ,以 此 
识别 出 引用 变量 。 另 一 轮 是 向 后 传播 , 从 流出 变量 回溯 活性 信息 ， 以 此 识别 出 哪些 引用 变量 在 哪 
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些 阶 段 上 是 活跃 的 。 然 后 对 于 每 个 安全 点 ， 编 译 吉 了 解 这 一 点 上 所 有 的 活跃 引用 变量 ,并 把 这 些 
信息 保存 在 这 个 安全 点 的 GC-map 中 。 对 栈 帧 中 元 素 也 进行 同样 的 处 理 。 寄 存 带 主要 用 来 保存 来 
自 局 部 变量 和 栈 中 的 数据 , 以 获得 更 快 的 处 理 速度 , 所 以 寄存 器 中 的 引用 也 可 以 从 局 部 变量 和 栈 
推断 出 来 ， 并 由 寄存 器 分 配 算法 维护 。 


为 所 有 方法 的 所 有 调用 点 维护 GC-map 信息 会 导致 空间 开销 。 研究 表明 ， 所 和 需 的 额外 空间 大 
小 约 为 所 有 SIT 生成 信息 的 10% 左 右 。 这 种 方法 用 空间 换取 运行 时 效率 。 

3. 惰性 生成 

也 可 以 在 回收 真正 发 生 的 时 候 才 只 为 栈 上 的 点 惰性 生成 GC-map。 也 就 是 说 ， 如 末 回 收 不 发 
生 就 不 维护 GC-map 信息 。 当 回收 发 生 的 时 候 ，VM 检查 栈 上 所 有 的 帧 ， 然 后 通过 重新 编译 对 应 
的 方法 或 模拟 方法 执行 到 栈 上 当前 安全 点 ， 为 每 一 帧 生成 一 个 GC-map。 注 意 需要 分 析 每 一 帧 来 
生成 它 自 己 的 GC-map， 同 一 个 方法 可 能 会 被 多 次 分 析 ， 因 为 这 同一 个 方法 可 能 被 多 个 线程 运行 
或 者 被 同一 个 线程 ( 间接 或 直接 ) 递归 运行 。 这 种 方法 试图 在 运行 时 开销 和 内 存 开销 之 间 找 到 平 
衡 点 ， 不 过 只 有 在 内 存 比 运行 时 效率 更 关键 的 时 候 ， 这 种 方法 才 是 有 用 的 。 

以 下 代码 是 一 个 Java 代码 根 集 枚 举 的 概念 化 实现 。GC-map 数据 结构 GC_map 包含 4 个 位 向 
量 , 指示 对 应 的 项 目 是 否 持 有 引用 。 这 里 不 一 定 要 有 4 个 位 向 量 , 而 要 根据 实际 实现 的 情况 而 定 。 


struct GC_map{ 


bitvector locals; // 局 部 变量 

bitvector temps; // 栈 上 的 临时 变量 
bitvector registers; // 有 引用 的 寄存 器 
bitvector args; // 调用 的 输出 参数 


} 


struct Safe_point{ 
uint32 eip; // 安全 点 PC 
GC_map* gc_map; 

} 


struct JIT_info{ 
JIT* jit; 
Method* method; 
void* code_addr; 
int code_size; 


// 这 个 方法 的 安全 点 数量 
tf 
int num_of_safepoints; 


// 下 面 这 个 数组 实际 上 是 动态 分 配 的 
// 有 num_of_safepoints 个 元 素 
Safe point* safepoint [1] 

} 


void java_enumerate_root_set (Frame_context* frame) 
{ 
Safe_point* safepoint = safepoint_of_frame(frame) ; 
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GC_map* gc_map = safepoint->gc_map; 
jit_enumerate_locals(frame, gc_map->locals) ; 
jit_enumerate_temps(frame, gc_map->temps) ; 
jit_enumerate_registers(frame, gc_map->registers) ; 
jit_enumerate_args(frame, gc_map->args) ; 


} 


以 下 代码 是 一 个 枚 举 寄存 器 的 示例 。 认真 查看 这 段 代码 , 可 以 发 现 它 实际 上 并 没有 枚 举 寄存 
费 本 身 ， 而 是 枚 举 保存 寄存 器 的 内 存 槽 位 。 稍 后 我 们 会 解释 原因 。 
// 在 进入 GC 之 前 ， 寄 存 器 保存 在 栈 上 


void jit_enumerate_registers(Frame_context* frame, 
bitvector bv) 
{ 
// 找到 保存 寄存 器 的 起 始 地 址 


uint32 start_addr = register_saved_start_addr(frame) ; 


for( int i=0; i< reg_num; i++) { 
if( test_bit(bv, i) == 0 ) continue; 
// 4k HAZ AAAI ABAD A 4S] 
uint32 root_slot = start adar + i*slot_size; 
gc_add_root ( (Object**) root_slot); 


} 


在 这 段 示例 概念 代码 中 , 持 有 一 个 对 象 引 用 的 内 存 地址 称 为 根 槽 位 , 这 个 地 址 被 加 入 到 根 集 
中 用 于 GC. 第 5 章 已 经 介绍 过 ， 当 GC 需要 从 根 遍 历 对 象 图 时 ， 它 会 像 下 面 这 样 解 引用 根 槽 位 。 


Object* root_ref = *(Object**) root_slot; 


当 GC 移动 对 象 时 ， 必 须 把 这 个 覃 位 更 新 为 持 有 指向 对 象 新 位 置 的 新 引用 。 
Object* ref = *(Object**) slot; 

// 把 对 象 从 ref 移动 到 new_ref 

Object* new_ref = object_copy (ref); 

// 更 新 原来 村 有 ref 的 槽 位 


*(Object**) slot = new ref; 

如 果 男 一 个 内 存 槽 位 持 有 指向 同一 个 已 被 移动 的 对 象 的 引用 , 它 的 内 容 也 应 该 被 更 新 到 指向 
新 地 址 。 这 个 槽 位 只 持 有 旧 对 象 地 址 ， 所 以 GC 需要 一 种 方法 来 找到 移动 对 象 的 新 位 置 。 一 个 解 
决 方案 是 由 回收 器 在 原来 的 对 象 中 保存 新 地 址 值 ， 称 为 转发 指针 (forwarding pointer )， 因 为 原来 
的 对 象 已 经 不 再 有 用 。 之 后 当 GC 接触 持 有 引用 的 覃 位 时 ,会 检查 被 引用 对 象 的 一 个 标志 来 确定 
它 是 否 已 被 移动 。 如 果 对 象 被 移动 过 ， 回 收 器 就 更 新 这 个 槽 位 ， 指 向 新 位 置 。 和 否则 ， 就 移动 这 个 
对 象 。 这 个 逻辑 有 点 像 下 面 的 代码 。 

Object* ref = *(Object**) slot; 

// 假定 新 地 址 保存 在 原来 对 象 头 中 

// 头 中 的 一 个 位 指示 对 象 是 否 被 移动 过 

Object* new_ref = NULL; 

if( is_forwarded(ref) ) { 


// 如 果 它 被 移动 过 ， 加 载 新 地 址 


new_ref = forwarding_ pointer (ref); 
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}else{ 

// 把 对 象 从 ref 移动 到 new_ref 
new_ref = object_copy(ref); 

} 

// 更 新 持 有 root_ref 的 槽 位 

*(Object**)slot = new_ref; 

在 并 行 GC 实现 中 ， 有 可 能 多 个 回收 器 ( 从 对 象 图 不 同 的 遍历 路 径 ) 到 达 同 一 个 对 象 并 试图 
移动 它 ,， 所 以 如 果 回 收 器 彼此 有 竞争 , 那么 其 对 象 移动 操作 必须 是 互 斥 的 ， 只 有 一 个 回收 需 可 以 
成 功 移动 这 个 对 象 。 失败 的 回收 器 会 提取 对 象 的 新 地 址 并 以 此 修改 自己 的 槽 位 ,使 用 事务 存储 支 
持 ， 这 个 过 程 可 能 会 有 所 不 同 ， 第 19 章 将 介绍 这 一 点 。 


9.2.2 ” 带 寄存 器 的 栈 展开 


为 了 支持 移动 对 象 的 GC ( 也 就 是 移动 式 GC), GC 在 内 存 和 栈 中 枚 举 根 槽 位 。 接 下 来 的 问 
题 就 是 GC 如 何 枚 举 寄存 器 ， 因 为 寄存 融 不 在 内 存 中 ， 又 总 是 被 活跃 使 用 着 。 


在 Java 方 法 的 调用 点 上 ,JIT 通常 在 调用 之 前 把 调用 方 保存 寄存 器 保存 在 栈 上 ， 而 被 调用 方 
保存 寄存 器 保持 不 动 。 如 果 被 调用 方法 需要 使 用 这 些 被 调用 方 保 存 寄存 器 , 那么 它们 会 在 使 用 之 
前 保存 ， 然 后 在 返回 之 前 恢复 。 


如 果 被 调用 方 保 存 寄 存 器 中 包含 对 象 引 用 ， 并 且 在 被 调用 方 执行 的 过 程 中 发 生 GC, ABATE 
被 调用 方 保存 寄存 器 的 引用 对 象 被 移动 过 的 情况 下 ， 这 个 引用 也 需要 被 更 新 为 新 地 址 。 


寄存 器 枚 举 的 解决 方案 很 简单 : 把 它们 保存 在 栈 上 ,然后 枚 举 栈 模 位。 回收 完成 之 后 ,在 修 
改天 执行 恢复 之 前 ， 把 这 些 值 恢复 到 寄存 器 中 。 这 与 方法 调用 是 一 样 的 。 


如 果 所 有 寄存 器 都 是 调用 方 保存 寄存 器 , 在 执行 调用 指令 之 前 , 有 活跃 数据 的 寄存 器 都 已 被 
保存 在 栈 上 。 因 为 JIT 了 解 调用 点 上 栈 的 GC-map， 所 以 GC 枚 举 它们 并 更 新 它们 的 值 没 有 任何 
问题 。 在 调用 之 后 ， 调 用 方 把 保存 的 数据 恢复 到 寄存 器 中 ， 现 在 这 些 寄存 器 就 有 了 最 新 数据 。 


如 果 有 些 寄存 器 是 被 调用 方 保存 寄存 器 , 并 有 待 被 调用 方法 使 用 , 它们 会 在 被 调用 方 的 起 始 
代码 中 被 保存 ， 在 结束 代码 中 恢复 。 通 过 这 种 方式 ， 如 果 被 调用 方法 内 发 生 GC 的 话 ， 那 么 被 调 
用 方 保存 寄存 器 停留 在 被 调用 方 的 栈 帧 中 。( 实际 上 , 它们 是 作为 调用 方 栈 帧 的 一 部 分 被 报告 的 ， 
因为 它们 持 有 调用 方 执行 状态 数据 ， 只 有 调用 方 了 解 它 们 是 否 持 有 任何 对 象 引 用 。) 


现在 我 们 需要 修改 Frame_context 数据 结构 , 使 得 它 不 仅 持 有 重要 的 指针 ,而 且 还 拥有 保 
存在 栈 上 寄存 器 的 栈 地 址 。 通 过 这 种 方式 ，JIT 可 以 枚 举 这 些 “ 寄 存 器 槽 位 ”来 支持 移动 式 GC. 


Frame_context 的 旧 有 设计 如 下 : 


struct Frame_context { 
uint32 ebp; 
uint32 esp; 
uint32 eip; 
M2N_wrapper* jcp; // Java #48# 
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修改 后 的 设计 可 以 像 下 面 这 样 ， 把 寄存 器 所 在 的 栈 槽 位 地 址 包含 进来 。 


struct Frame_context { 
uint32 ebp; 
uint32 esp; 
uint32 eip; 
M2N_wrapper* jcp; 


// 被 调用 方 保存 寄存 器 
uint32 *p_edi; 
uint32 *p_esi; 
uint32 *p_ebx; 


// 调用 方 保存 寄存 器 
uint32 *p_eax; 
uint32 *p_ecx; 
uint32 *p_edx; 


} 


VM 在 展开 栈 的 时 候 ， 会 在 JIT 的 帮助 下 用 正确 的 值 为 寄存 器 填充 帧 上 下 文 。 假 定 调 用 方 保 
存 寄 存 天 在 调用 的 传 出 参数 之 前 保存 , 并 且 被 调用 方 保存 寄存 器 在 被 调用 方 帧 的 起 始 处 保存 , 那 | 
么 栈 看 起 来 就 如 图 9-1 所 示 。 
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图 9-1 调用 前 后 的 栈 数据 
举 个 例子 ， 下 面 的 伪 代 码 展开 一 层 栈 帧 。 


Frame_context* preceding_frame(Frame_context* frame) 
{ 

int num_callee_saved = 0; 

uint32 ebp = 0 


Code_Type type = code_type(frame->eip) ; 
if( type == CODE_TYPE_JAVA ) { 
JIT_info* info = info_of_pc(frame->eip) ; 
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// 这 一 帧 里 被 调用 方 保存 寄存 器 的 数量 


num callee saved = info->num_saved_callee_ regs; 





// 找到 前 一 个 帧 上 下 文 
ebp = frame->ebp; 
frame->eip = ebp - 4; 
frame->esp = ebp - 8; 
frame->ebp = *(uint32*)ebp; 
jelse{ // eip 指向 本 地 代码 
// M2N_wrapper 中 被 调用 方 保存 寄存 器 数量 是 常量 
num callee saved = NUM_M2N SAVED REGS; 


M2N_wrapper* jcp = frame->jcp; 
if (jep == NULL) return NULL; 


ebp = jcp->ebp; 


frame->ebp = ebp; 

frame->eip = jcp->eip; 

frame->esp = jcp - SIZE_M2N_WRAPPER; 
frame->jcp = jcp->jcp; 


} 


// 假定 被 调用 方 寄存 器 总 是 按照 定义 顺序 保存 

switch (num callee saved) { 
case 3: frame->p_edi = (uint32*) (ebp - 12); 
case 2: frame->p_esi = (uint32*) (ebp - 8); 
case 1: frame->p_ebx = (uint32*) (ebp - 4); 
case 0: break; 
default: assert (0); 

} 


return frame; 


} 

这 段 示 例 代 码 只 关心 被 调用 方 保存 寄存 器 的 栈 槽 位 。 调 用 方 保存 寄存 器 的 槽 位 ,作为 调用 方 
帧 的 一 部 分 ， 是 调用 点 安全 点 处 的 GC-map 所 了 解 的 。 这 里 ,我 们 假定 被 调用 方 保存 寄存 器 总 是 
按 顺 序 保存 。 也 就 是 说 ， 如 果 被 调用 方 只 保存 一 个 被 调用 方 保存 寄存 器 ， 那 一 定 是 ebx; 如 果 保 
存 两 个 ， 那 一 定 是 ebx 和 esis 

帧 上 下 文 也 包含 调用 方 保 存 寄 存 器 。 这 用 于 帧 不 在 调用 点 上 ， 而 是 在 硬件 异常 上 的 情况 。 调 
用 方 保存 寄存 器 中 的 值 不 是 由 异常 之 前 的 方法 来 保存 ,而 是 由 硬件 在 异常 上 下 文中 保存 的 ,异常 
上 下 文 也 应 该 被 枚 举 。 


9.3 ”在 本 地 代码 中 支持 垃圾 回收 


本 地 方法 不 能 与 Java 方 法 使 用 同样 的 垃圾 回收 支持 技术 ,原因 有 以 下 两 点 。 


O 如 果 在 回收 发 生 时 本 地 栈 帧 中 有 引用 指针 ， 那 么 VM 不 能 精确 地 分 辨 它 究 竞 是 指针 、 整 
数 还 是 其 他 数据 类 型 ， 因 为 它 不 了 解 本 地 帧 布局 ， 所 以 无 法 支持 精确 式 GC. 
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口 另 一 个 问题 更 严重 。 如 果 本 地 代码 可 以 直接 访问 对 象 指针 ， 本 地 编译 器 可 能 会 把 它 保 存 
在 物理 寄存 器 或 者 其 他 本 地 控制 的 位 置 〈 本 书 称 为 “本 地 位 置 ”) 中 , 但 这 是 VM 不 了 
解 的 。 这 种 情况 下 ， 即 使 保守 式 GC 也 是 不 可 能 的 。 如 果 一 个 对 象 在 回收 过 程 中 被 移 
动 ， 而 新 地 址 没有 更 新 到 本 地 位 置 中 ， 那 么 后 续 本 地 代码 对 这 个 对 象 指针 的 访问 会 导致 
意外 的 结 
上 述 问 题 的 解决 方案 是 不 允许 本 地 代码 像 Java 代码 那样 直接 访问 对 象 引 用 ， 而 是 把 对 象 指 
针 存 储 在 一 个 独立 的 由 VM 控制 的 位 置 ( 本 书 称 为 “托管 位 置 ” ), 本 地 代码 只 能 间接 访问 这 些 对 
象 指针 。 针 对 上 述 两 个 问题 的 对 策 如 下 。 


O 对 象 指针 保存 在 托管 位 置 ， 所 以 VM 可 以 精确 枚 举 它 们 ， 支 持 精 确 式 GC. 
O 本 地 代码 不 能 直接 访问 对 象 指针 ， 所 以 本 地 编译 带 没 有 办 法 把 它们 放 在 本 地 位 置 。 通 过 
这 种 方式 ，VM 确保 对 象 指针 保存 在 托管 位 置 ， 并 且 也 只 能 保存 在 托管 位 置 。 


9.3.1 对 象 引用 访问 


为 了 支持 间接 引用 访问 ，JNI 定 义 了 局 部 引用 和 全 局 引用 。 局 部 引用 就 像 是 局 部 变量 ， 只 存 
在 于 本 地 方法 作用 域 之 内 。 全 局 引用 可 以 在 本 地 方法 之 外 存活 ， 直 到 它 被 显 式 释 放 。 局 部 和 全 局 
引用 在 支持 精确 式 GC 的 同时 ， 也 支持 本 地 方法 传递 和 返回 Java 对 象 ， 以 及 访问 和 创建 Java 对 
象 。 也 就 是 说 , 精确 式 GC 发 生 的 时 候 , 在 栈 中 间或 者 栈 顶 上 可 以 存在 本 地 帧 。JNI 没有 规定 VM 
如 何 实现 局 部 和 全 局 引用 。 

间接 对 象 引 用 访问 的 实现 可 以 把 对 象 引用 装 箱 到 对 象 句柄 中 ,对象 句柄 是 链接 在 一 起 的 ,这 
FE VM 可 以 找到 所 有 对 象 句柄 。 县 体 实现 如 图 9-2 所 示 。 


obj_ref3 


obj_ref2 obj_refl 








图 9-2 ”组 织 为 链表 的 对 象 句柄 


Object_handle 数据 结构 可 以 是 一 个 简单 的 间接 层 : 


struct Object_handle{ 
Object* obj; 
} 


为 了 便于 管理 ， 把 object_handle tk AZ object_handle_node 中 。 


struct Object_handle_node{ 
Object* obj; 
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Object_handle_node* next; 
Object_handle_node* prev; 
} 


指向 每 个 对 象 的 指针 都 被 封 箱 到 对 象 句 柄 中 。 本 地 代码 通过 obj_refl 访问 obj1. 在 内 部 ， 
VM 可 以 通过 如 下 代码 取得 这 个 对 象 : 


objl = obj_refl->obj; 


或 者 : 


obji = * Object ropi retl; 


这 段 代码 不 能 在 回收 正在 发 生 的 时 候 执 行 ,， 因 为 GC 可 能 会 移动 这 个 对 象 ， 留 下 一 个 无 效 对 象 指 
针 ， 所 以 是 不 安全 的 。 它 必须 由 VM 保护 ，VM 可 以 阻止 回收 发 生 。 概 念 上 来 说 ， 它 应 该 被 下 面 
这 样 的 代码 所 包 囊 : 

thread_leave_saferegion() ; 

objil = obj_refl->obj; 

// 既然 GC 被 禁止 ， 那么 objl 是 有 效 的 

. 访问 wj sas 

thread_enter_saferegion(); 

每 个 方法 运行 实例 有 一 个 对 象 句柄 列表 , 其 中 维护 了 本 地 代码 可 以 访问 的 所 有 对 象 。 列 表 头 
保存 在 本 地 方法 帧 中 ,所 以 GC 能 够 找到 它 来 枚 举 对 象 。 方 法 返回 的 时 候 丢弃 这 些 对 象 句 柄 ( 而 
不 是 对 象 )。 我们 在 M2N_wrapper 数据 结构 中 增加 一 个 条 目 来 存储 这 个 对 象 句柄 列表 头 ， 如 以 
下 代码 所 示 。 


struct M2N_wrapper{ 
M2N_wrapper *jcp; 
M2N_wrapper **addr_jcp; 
Object_handle_ node *local_obj_handles; 
uint32 edi; 
uint32 esi; 
uint32 ebx; 
uint32 ebp; 
uint32 eip; 


} 


如 果 INT API 函数 返回 一 个 对 象 引用 的 话 ， 必 须 把 它 封装 为 一 个 对 象 句柄 ， 只 返回 指向 这 个 
对 象 句柄 的 指针 。 

方法 参数 是 局 部 变量 的 一 部 分 。 本 地 方法 的 参数 中 可 能 包含 对 象 引用 ， 定 义 在 方法 签名 中 。 
在 本 地 代码 中 也 通过 对 象 句柄 访问 它们 。 在 Java 到 本 地 转换 封装 代码 中 ， 为 本 地 方法 压 栈 参 数 
的 时 候 , 封装 代码 应 该 创建 对 象 句柄 来 封装 引用 参数 , 并 把 对 象 句柄 地 址 作为 传 给 本 地 代码 的 实 
际 参数 压 栈 。 

即使 方法 引用 参数 的 个 数 在 编译 时 已 经 知道 ，VM 也 不 能 在 为 方法 生成 封装 代码 的 时 候 ， 还 
为 这 个 方法 创建 对 象 句柄 。 这 是 因为 ,正如 前 面 已 经 提 到 的 ， 就 像 方法 的 自动 变量 一 样 ， 对 象 句 
柄 是 动态 数据 结构 ， 存 在 于 每 个 方法 的 调用 实例 中 。 
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有 了 局 部 对 象 句 柄 ， 就 可 以 在 本 地 代码 中 枚 举 根 集 ， 如 以 下 代码 所 示 。 


void native_enumerate_root_set (Frame_context* frame) 
{ 
M2N_wrapper* m2n = frame->jcp; 
Object_handle_node* node = m2n->local_obj_handles; 


while (node) { 
gc_add_root ( (Object **) node) ; 
node = node->next; 
} 
} 


既然 一 旦 本 地 方法 返回 局 部 对 象 句 柄 就 被 释放 , 那么 就 不 可 能 在 方法 作用 域 之 外 保持 这 个 被 
引用 对 象 活跃 。 全 局 对 象 句 柄 的 实现 方式 与 局 部 对 象 句 柄 相同 。 唯 一 的 区 别 是 ,其 对 象 句 柄 列表 
头 在 VM 中 是 全 局 唯一 的 。 这 个 列表 中 的 对 象 句柄 节点 只 能 显 式 释放 。 


93.2 ”对 象 句柄 实现 


每 个 本 地 方法 应 该 至 少 有 一 个 引用 参数 ( 对 于 非 静态 方法 是 对 象 实例 , 对 于 静态 方法 是 类 实 
例 )， 所 以 封装 代码 总 是 需要 处 理 对 象 句柄 。 需 要 修改 前 面 给 出 的 封装 代码 示例 把 这 项 工作 包含 

封装 代码 创建 与 引用 参数 同样 多 的 对 象 句柄 节点 。 可 以 在 编译 时 通过 在 参数 上 迭代 判断 其 类 
型 来 计算 出 这 个 数目 。 然 后 封装 代码 把 这 些 对 象 句 柄 节点 链接 在 一 起 ， 并 把 指向 M2N_wrapper 
条 目的 头 指针 放 在 栈 上 。 最 后 ， 它 把 包含 引用 参数 对 象 句 柄 在 内 的 本 地 方法 参数 奈 栈 ,然后 调用 
这 个 方法 。 当 这 个 本 地 方法 返回 时 , 封装 代码 应 该 释放 为 这 个 方法 创建 的 以 及 这 个 方法 内 的 所 有 
对 象 句柄 节点 。 


// 首先 保存 被 调用 方 保存 寄存 器 
push ebp 
push ebx 
push esi 
push edi 


// 指向 局 部 对 象 向 柄 的 列表 头 指针 占 位 符 
push 0 


// #38 aR ABE BE 

call get_address_of_cluster_pointer 
push eax 

push [eax] 

mov esp -> [eax] 


// 准备 局 部 对 象 句柄 

push method // (Method*)method #4i J native_add 
call new_local_obj_handles 

// 返回 值 eax 持 有 指向 句柄 的 头 指 针 

pop // 弹出 输入 “method” 
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// 压 栈 本 地 方法 参数 

push [esp+size_M2N_wrapper] // ARY 
push [esp+size_M2N_wrapper+8] // ARX 
push eax // AR Add 类 的 局 部 对 象 铝 柄 

push addr_JNI_Env // 压 栈 JNI 环境 变量 

// 调用 实际 本 地 方法 实现 

call Java_Add_native_ladd 

mov eax -> ebx // 保存 返回 值 


// 如 果 返 回 值 是 引用 值 ， 解 封 它 
// 也 就 是 得 到 要 返回 的 实际 对 象 指 针 
// 如 果 返 回 引用 值 为 null， 不 解 封 
xor ebx ebx 
je unhandle done 
mov [ebx] -> ebx 
unhandle done: 
// ERA BIH R 2) 4H 
call free_local_obj_handles 
// 恢复 返回 值 


mov ebx -> eax 


// 恢复 Java RH 
pop ecx 
pop ebx 
mov ecx -> [ebx] 


// 恢复 被 调用 方 保存 寄存 器 
pop edi 

pop esi 

pop ebx 

pop ebp 

// 返回 并 弹出 Java 参数 (x，y) 
ret 8 


我 们 仍 使 用 和 之 前 一 样 的 应 用 程序 示例 来 说 明 这 个 设计 。 它 的 本 地 方法 nat ive_add () Æi 
态 的 ， 所 以 有 一 个 类 实例 引用 参数 。 


public class Add{ 

public static native int native_add(int x, int y); 

public static int add(int x, int y){ 

return native_add(x, y); 

} 
} 
JNIEXPORT jint JNICALL Java_Add_native_ladd 

(JNIEnv *, jclass, jant., jint); 


在 之 前 关于 封装 设计 的 讨论 中 , 类 实例 的 引用 作为 参数 在 栈 上 传递 给 本 地 代码 。 现 在 栈 上 应 
该 用 对 象 句 柄 指针 代替 它 ， 如 图 9-3 所 示 。 
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图 9-3 调用 进入 本 地 方法 之 前 的 栈 状 态 


注意 图 9-3 中 加 粗 代码 体 的 两 个 新 增 条 目 : 一 个 是 Ada 类 实例 的 对 象 句 顶 , 男 一 个 是 局 部 对 
象 句 柄 的 列表 头 。 它 们 都 指向 同一 个 对 象 句柄 节点 , 也 是 这 个 本 地 方法 执行 一 开始 时 列表 中 的 唯 


He 
a has 


Jk BCS fH FAS PR SOK Ah SU a ae Ea A a ERE, WR rs o 


Object_handle_node* get_local_obj_handles () 
{ 
VM_Thread* thread = current_thread(); 
M2N_wrapper* jcp = thread->jcp; 
Object_handle_node* handles = jcp->local_obj_handles; 
return handles; 


} 


Object_handle_node* new_local_obj_handles (Method* method) 
{ 
Object_handle_node* handles = get_local_obj_handles(); 
assert( handles == NULL ); 
// A method 的 引用 参数 生成 句柄 
// 从 头 开 始 按照 参数 顺序 链接 
handles = ... 
return handles; 
} 


void free_local_obj_handles () 
{ 


Object_handle_node* handles = get_local_obj_handles(); 


assert( handles != NULL ); 
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// 释放 所 有 对 象 铅 枉 节 点 
} 


为 了 提高 性 能 , 可 以 用 机 咒 码 序列 代替 创建 和 释放 局 部 对 象 句柄 的 函数 。 由 于 通常 在 堆 上 分 
配 内 存 比 在 线程 局 部 的 栈 上 分 配 代价 更 高 ， 在 栈 上 为 引用 参数 分 配对 象 句 柄 也 是 一 种 性 能 优化 。 
如 果 放 在 栈 上 释放 甚至 会 更 快 ， 因 为 封装 代码 返回 调用 方 就 附带 完成 了 释放 。 

有 了 对 象 句 柄 的 支持 ， 本 地 代码 可 以 支持 其 执行 过 程 中 的 精确 式 GC。 换 名 话说， 从 应 用 程 
序 开发 者 的 角度 来 说 ， 只 要 使 用 JNI 应 用 程序 编程 接口 (API )， 在 本 地 方法 的 任何 位 置 ( 也 就 是 
说 ， 本 地 方法 是 一 个 GC 安全 区 域 ) 上 都 可 以 进行 精确 式 GC， 而 不 需要 插 和 人 对 本 地 代码 来 说 不 
可 行 的 安全 点 。 


9.3.3 ”GC 安全 性 维护 


与 之 相 比 ，Java 方 法 本 身 是 非 GC 安全 的 , 需要 插入 安全 点 为 GC 发 生 提供 机 会 。 当 Java Fr 
法 调用 本 地 方法 时 ， 代 码 变 成 了 GC 安全 的 。 那 么 问题 就 是 ， 当 Java 方 法 调用 本 地 方法 的 时 候 ， 
如 何 实现 GC 安全 性 状态 切换 。 我 们 自然 会 把 切换 代码 放 到 本 地 方法 封装 代码 中 。 应 该 把 打开 / 
关闭 GC 代码 插入 到 本 地 方法 调用 的 前 后 ， 就 如 下 面 这 段 修改 过 的 封装 代码 所 示 。 


// 首先 保存 被 调用 方 保存 寄存 器 
push ebp 
push ebx 
push esi 
push edi 


// 48 16) By PAP A 8) 4H K AGH AY b ALA 
push 0 


// 构造 旋 指 针 链 

call get_address_of_cluster_pointer 
push eax 

push [eax] 

mov esp -> [eax] 


// 准备 局 部 对 象 句 栖 

push method // (Method*)method 描述 了 native_add 
call new_local_obj_handles 

// 返回 值 eax 持 有 指向 句柄 的 头 指 针 

pop // HATA “method” 


// 压 栈 本 地 方法 参数 

push [esp+size_M2N_wrapper] // ARY 
push [esp+size_M2N_wrapper+8] // ARX 
push eax // ÆR Add 类 的 局 部 对 象 句 柄 

push addr_JNI_Env // ÆR INI 环境 变量 

// 为 本 地 方法 打开 GC 

call thread enter saferegion 

// 调用 实际 本 地 方法 实现 

call Java_Add_native_ladd 
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mov eax -> ebx // 保存 返回 值 
// 为 本 地 方法 关闭 GC 


call thread_leave_saferegion 


// 如 果 返 回 值 是 引用 值 ， 解 封 它 

// 也 就 是 得 到 要 返回 的 实际 对 象 指 针 

// 如 果 返 回 引用 值 为 null， 不 解 封 

// xor ebx ebx 

// je unhandle_done 

// mov [ebx] -> ebx 
unhandle_done: 

// 释放 局 部 对 象 句柄 

call free_local_obj_handles 

// 恢复 返回 值 


mov ebx -> eax 


// 恢复 Java ABH 
pop ecx 
pop ebx 
mov ecx -> [ebx] 


// 恢复 被 调用 方 保 存 寄存 器 
pop edi 
pop esi 
pop ebx 
pop ebp 
// 返回 并 弹出 Java 参数 (x，y) 
ret 8 
把 打开 /关闭 GC 代码 插入 到 Java 到 本 地 封装 代码 后 ，VM 保证 了 当 Java 代码 调用 本 地 方法 
时 的 GC 安全 不 变性 。 


9.3.4 ”对 象 体 访问 


现在 我 们 已 经 有 了 在 本 地 代码 中 实现 对 象 引 用 访问 的 解决 方案 , 还 需要 一 个 对 象 体 访问 的 解 
决 方案 。VM 不 允许 本 地 代码 持 有 指向 对 象 的 指针 ， 因 此 ， 本 地 代码 没有 办 法 通过 指针 算术 访问 
对 象 体 。 对 象 体 访问 必须 像 对 象 引用 访问 一 样 间接 实现 。 

间接 对 象 体 访问 的 一 种 实现 可 以 引入 一 个 从 变量 索引 到 对 象 字 段 的 映射 表 。 当 本 地 代码 访问 
对 象 引 用 变量 的 时 候 , 它 实际 上 访问 的 是 这 个 变量 的 索引 。 然 后 VM 把 这 个 索引 映射 到 对 象 字段 
地 址 ， 并 完成 本 地 代码 需要 的 操作 。 可 以 通过 任何 方式 实现 这 个 索引 ， 只 要 它 唯 一 标识 字段 , 能 
够 用 于 获取 字段 信息 即 可 。 

JNI 定 义 了 实现 这 个 目标 的 API。 举 例 来 说 , 在 Java 代码 中 , 如果 要 把 对 象 obj 的 引用 字段 
field 设置 为 value， 就 像 以 下 代码 一 样 简单 。 

obj.field = value; 


使 用 INT API 的 话 , 本 地 代码 需要 使 用 下 面 这 个 郴 数 , 其 中 对 象 字段 field 被 替换 为 一 个 索 
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引 fieldID。jobject 类 型 的 参数 是 用 对 象 句柄 传递 的 引用 参数 。 


void JNICALL SetObjectField(JNIEnv * jni_env, 
jobject obj, 
jfieldID fieldID, 
jobject value); 


这 些 API 应 该 由 VM 实现 ， 因 为 VM 最 终 得 直接 访问 这 个 对 象 字 段 来 操作 它 。 问 题 是 VM 
如 何 确保 安全 性 和 可 移植 性 ， 并 支持 精确 式 GC。 答 案 是 在 进入 可 能 的 非 GC 安全 区 域 或 者 当代 
码 可 能 是 非 GC 安全 的 时 候 ，VM 需要 关闭 GC。 如 果 关 闭 GC, 那么 GC 就 不 会 发 生 ， 这 样 就 确 
保 了 没有 对 象 会 被 移动 。 以 下 代码 是 上 述 JNIAPI 的 一 个 实现 示例 。 


// VM 代码 访问 一 个 对 象 的 对 象 字段 

jobject GetObjectField(JNIEnv *env, 
jobject jobj, 
jfieldID fieldID) 


// 把 字段 ID 转换 为 VM 的 字段 描述 

Field *fld = (Field*)fieldID; 

if (!class_initialize(env, fld->get_class())) 
return NULL; 


if (ExceptionCheck (env) ) 
return NULL; 


// A vm_disable_gc() 
thread_leave_saferegion(); 


// 访问 Java 对 象 字段 

Object* java_ref = (Object_handle) jobj-sobj; 
// 得 到 这 个 字段 在 对 象 中 的 偏 移 量 

uint32 offset = fld->get_offset(); 
Object_handle* new_handle = NULL; 


Object* fld obj = *(Object**) (java_ref + offset); 
if( fld_obj != NULL ){ 

// 对 于 非 NULL 31A, 4t4a 

new_handle = allocate_local_obj_handle(); 

if (new handle != NULL) { 

new_handle->obj = fld_obj; 

} 

} 


// 同 vm_enable_gc() 
thread_enter_saferegion(); 


return (jobject)new_handle; 
} 


VM 离开 /进入 安全 区 域 这 两 个 函数 确保 了 VM 代码 在 它们 之 间 访 问 对 象 的 时 候 不 会 发 生 回 
收 。 如 果 在 代码 离开 安全 区 域 之 前 触发 了 回收 ， 调 用 thread_leave_saferegion() 的 线程 会 
阻塞 在 这 个 函数 上 ， 直 到 回收 结束 才 会 继续 。 第 6 章 已 经 介绍 过 这 一 点 。 
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使 用 JNI API， 应 用 程序 可 以 开发 如 下 代码 来 访问 一 个 对 象 字 段 ， 其 字段 名 和 类 型 分 别 为 
fname 和 Etype. 
// 访问 对 象 中 的 一 个 引用 字段 的 应 用 程序 代码 
jobject ReadObjectField(JNIEnv *env, 
jobject obj, 
const char * fname, 
const char * ftype,) 





1: // 得 到 obj HARK Hl M4 xt F 2) 45 


jclass clazz = (*env)->GetObjectClass(env, obj); 


2: // 得 到 带 有 名 称 和 签名 的 字段 描述 
jfieldID fid = (*env)->GetFieldID(env, clazz, fname, ftype); 
if (fid == NULL) return NULL; 


3: /* 加 载 指向 对 象 负 本 的 字段 数据 (一 个 引用 ) */ 
jobject fobj = (*env)->GetObjectField(env, obj, fid); 
return fobj; 

} 


jclass, jobject 和 jfieldID 的 类 型 对 应 用 程序 代码 来 说 是 不 透明 的 。 应 用 程序 开发 者 

不 应 该 对 它们 的 实际 定义 做 出 假设 。 3 
与 它们 在 Java 中 的 对 应 物 类 似 ， 作 为 对 象 句 柄 的 jclass 类 型 和 jobject 类 型 的 变量 ,在 

对 象 句柄 的 活跃 期 间 保 持 着 被 引用 对 象 的 活性 ,这 是 由 本 地 语言 语义 所 决定 的 。 这 种 情况 下 , 它 

们 的 生存 期 是 从 它们 的 声明 点 直到 方法 返回 点 。 这 意味 着 , 如 果 在 语句 1 和 语句 2 之 间 发 生 回 收 ， 

那么 对 clazz 的 访问 仍然 有 效 。 


9.3.5 ”对 象 分 配 


除了 访问 Java 对 象 ， 本 地 代码 也 可 以 创建 一 个 Java 对 象 ， 并 把 它 返 回 到 Java 代码 。 这 个 对 
象 在 本 地 方法 中 创建 时 被 封 箱 到 局 部 对 象 句柄 中 ， 在 返回 到 Java 世界 时 应 该 被 解 封 。 解 封 (或 
者 句柄 解 绑 ) 操作 在 本 地 方法 的 封装 代码 中 执行 ， 之 前 的 封装 代码 中 已 经 展示 了 这 一 部 分 。 
下 面 的 一 段 示 例 代 码 展示 了 如 何在 VM 代码 中 创建 一 个 新 对 象 。 这 是 INI API NewObjectA () 
的 实现 。 参 数 meth 和 args 是 这 个 对 象 的 构造 器 及 其 参数 。 
jobject JNICALL NewObjectA(JNIEnv * jenv, 
Jelase eLeg.,, 
jmethodID meth, 
jvalue *args) 
if (ExceptionCheck(jenv) || clzz == NULL ) return NULL; 


Class* clss = jclass_to_Class(clzz); 


if(clss->is_interface() || clss->is_abstract()) { 
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// 接口 或 抽象 类 不 能 实例 化 
char* cname = clss->get_name()->bytes; 
ThrowNew(jenv, Clazz_InstantiationException, cname) ; 
return NULL; 

} 

if (!class_initialize(jni_env, clss)) { 
return NULL; 

} 


thread_leave_saferegion(); 

// 用 类 型 clss 分 配 一 个 对 象 

Objectx new_obj = gc_alloc_object (clss); 

// BAN HAH, VG ARS Ha HAT HR 

Object_handle handle = allocate_local_obj_handle(); 

if (new_obj == NULL || handle == NULL) { 
// ARETE obj, REDEE ak, Eik 
thread_enter_saferegion(); 
return NULL; 

} 

// A & 4) 443th ha 

handle->object = new_obj; 

thread enter _saferegion(); 


// 用 参数 调用 构造 器 
CallNonvirtualVoidMethodA(jenv, handle, clzz, meth, args); 
if ( ExceptionCheck(jenv) ) return NULL; 


return handle; 
} 


函数 调用 gc_alloc_object () 返 回 一 个 对 象 引 用 ， 所 以 这 是 一 个 非 GC 安全 操作 ， 必 须 在 
JE GC 安全 区 域 操作 。 另 一 方面 ， 如 果 堆 空间 太 少 ， 可 能 会 触发 GC 事件 。 这 不 是 一 个 问题 ， 因 
为 vm_trigger_gc() 就 是 假定 发 生 在 非 GC 安全 区 域 的 。 

除了 局 部 对 象 句柄 , 还 有 其 他 一 些 线程 局 部 对 象 也 应 该 被 枚 举 。 根据 VM 实现 的 不 同 , 这 可 
能 是 还 没有 被 异常 处 理 函 数 处 理 的 异常 对 象 ， 或 者 一 个 阻塞 的 monitor 对 象 。 

显然 , 本 地 代码 的 运行 时 开销 要 远 远 高 于 Java 代码 。 这 是 在 本 地 代码 中 支持 GC 的 代价 , 是 
为 了 维护 安全 性 和 可 移植 性 语义 所 需 的 。 这 些 API 向 本 地 代码 ( 和 本 地 编译 器 ) 隐藏 了 对 象 实现 
的 所 有 细节 。 只 有 VM 了 解 这 些 细节 ， 并 代表 本 地 代码 在 对 象 上 执行 实际 的 操作 。 


9.4 在 同步 方法 中 支持 垃圾 回收 
同步 方法 如 何 支持 GC 值得 介绍 一 下 。 


9.4.1 同步 Java 方法 


在 同步 Java 方法 的 开端 和 结尾 ， 应 该 分 别 在 处 理 被 调用 方 保 存 寄存 器 压 栈 之 后 以 及 出 栈 之 
前 插入 如 下 代码 。 


94 在 同步 方法 中 支持 垃圾 回收 137 


// 被 调用 方 保存 寄存 器 已 经 压 栈 

// ÆR monitor 对 象 用 于 monitorenter 
push monitor_obj 

call vm_object_lock 


结尾 代码 : 

// 压 栈 monitor 用 于 monitorexit 

push monitor_obj 

call vm_object_unlock 

// 之 后 弹出 被 调用 方 保存 寄存 器 

图 数 vm_object_lock() 和 vm_object_unlock() 分 别 是 用 于 monitorenter 和 
monitorexit 的 运行 时 函数 。vm_object_lock() 的 执行 可 能 阻塞 等 待 monitor, 这 时 候 这 个 线 
程 不 应 该 阻止 回收 发 生 。 


在 Java 代码 中 , 尽管 调用 点 是 一 个 安全 点 ,一 旦 控制 转 出 安全 点 或 者 进入 Java 被 调用 方法 ， 
它 就 不 再 是 GC 安全 的 了 。VM 应 该 在 这 里 提供 GC 支持 ， 以 防 出 现 这 个 线程 被 monitor 阻塞 的 


下 面 的 代码 是 进入 monitor 的 慢 路 径 的 伪 代 码 。 慢 路 径 意味 着 如 果 线 程 无 法 获得 锁 就 可 能 阻 
塞 。 第 6 章 中 已 经 讨论 过 这 段 代 码 。 这 里 的 代码 有 如 下 两 处 修改 。 


(1) 线程 把 它 的 休眠 等 待 阶段 放 入 安全 区 以 允许 回收 发 生 。 
(2) 如 果 在 线程 休眠 时 确实 发 生 了 回收 ，monitor 对 象 可 能 已 经 被 移动 。 那 么 当 线 程 从 休眠 中 
醒 来 的 时 候 ， 需 要 从 枚 举 的 覃 位 中 重新 加 载 monitor 对 象 。 


void lock_blocking(Object* jmon) 
{ 
VM_Thread* self = thread_self(); 
// 试图 获得 锁 
while( !lock_non_blocking(jmon) ){ 
// 无 法 获得 锁 ， 进 入 休眠 
// 重新 加 载 被 阻塞 的 锁 
self->blocked_lock = jmon; 
self->status = THREAD_STATE_MONITOR; 





// 在 安全 区 域 休眠 等 待 
thread enter saferegion(); 
wait_for_signal( self->SIG_UNLOCK, 0); 
thread_leave_saferegion(); 

// 在 可 能 的 GC 之 后 重新 加 载 jmon 对 象 


jmon = self->blocked_lock; 


// 被 一 个 解锁 monitor 的 线程 叫 醒 
self->status = THREAD_STATE_RUNNING; 
self->blocked_lock = null; 

// 循环 回去 再 次 竞争 锁 
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// 最 终 获 得 锁 并 返回 
return; 


} 
在 VM 枚 举 每 个 线程 的 代码 中 ， 应 该 添加 如 下 代码 : 


VM_Thread* self = current_thread(); 
gc_add_root ( (Object **) & (self->blocked_lock) ); 


这 确保 回收 会 枚 举 到 这 个 monitor 对 象 (blocked_lock )， 实 际 上 是 枚 举 持 有 它 的 引用 的 槽 位 。 
在 VM 中 还 有 其 他 几 个 不 在 修改 器 执行 上 下 文中 的 对 象 。 它 们 都 可 以 通过 类 似 方式 处 理 。 


9.4.2 同步 本 地 方法 


如 果 是 一 个 同步 本 地 方法 ,那么 在 Java 到 本 地 封装 中 ,编译 器 应 该 在 打开 GC 之 前 插入 
monitorenter 代码 ， 并 在 关闭 GC 之 后 插入 monitorexit 代码 ， 如 下 所 示 。 


// 处 理 栈 上 的 M2N_wrapper 

// 压 栈 本 地 方法 参数 

push [esp+size_M2N_wrapper] // ERY 
push [esp+size_M2N_wrapper+8] // ERX 
push eax // FRR Aad Fy Ay spat F 2) 45 

push addr_JNI_Env // 压 栈 JNI 环境 变量 


// 为 monitorenter AR monitor 对 象 

// 为 monitorexit 在 esi 中 保存 monitor FR 
mov [eax] -> esi 

push esi 

call vm object lock 


// 为 本 地 方法 打开 GC 

call thread_enter_saferegion 
// 调用 实际 的 本 地 方法 实现 

call Java_Add_native_ladd 
mov eax -> ebx // 保存 返回 值 
// 为 本 地 方法 关闭 GC 


call thread_leave_saferegion 


// 为 monitorexit Æ monitor 对 象 
push esi 
call vm_object_unlock 


// 如 果 返 回 值 是 引用 类 型 就 解 封 它 
// 释放 局 部 对 象 句 柄 

// 恢复 返回 值 

// 恢复 M2N_wrapper 保存 数据 
// 返回 并 弹出 Java 参数 


这 段 代 码 是 有 用 的 , 因为 如 果 当 前 线程 在 vm_object_lock() 中 阻塞 时 发 生 GC, 所 有 引用 
参数 都 保存 在 GC 将 枚 举 的 局 部 对 象 句柄 中 。 唯 一 被 遗漏 的 根 是 monitor 对 象 ， 它 会 被 单独 正确 
枚 举 。 
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单独 枚 举 monitor 对 象 不 是 一 个 通用 解决 方案 。 更 通用 的 解决 方案 是 把 monitor 对 象 封 箱 到 
一 个 对 象 句柄 中 , 这 样 就 能 以 与 其 他 对 象 句柄 一 致 的 方式 枚 举 它 。 对 于 同步 本 地 方法 来 说 这 很 容 
易 实 现 , 在 调用 vm_object_lock() 之 前 , 它 已 经 初始 化 了 局 部 对 象 句柄 。 然 后 线程 等 待 monitor 
的 这 段 代 码 就 变 成 了 下 面 这 样 。 这 个 对 象 句 柄 被 自动 链接 到 由 本 地 方法 初始 化 好 的 局 部 对 象 句柄 
列表 中 。 


void lock_blocking(Object* jmon) 
{ 
VM_Thread* self = thread_self(); 


Object_handle* hndl = allocate_local_obj_handle(); 
hndl->obj = jmon; 


// 试图 获得 锁 
while( !lock_non_blocking(jmon) ) { 
// 不 能 获得 锁 ， 进 入 休眠 
// 记录 被 阻塞 的 锁 
self->blocked_lock = jmon; 
self->status = THREAD _STATE_MONITOR; 


// 在 安全 区 域 中 休眠 等 待 醒 来 

thread enter saferegion(); 
wait_for_signal( self->SIG UNLOCK, 0); 
thread leave saferegion(); 

// 在 可 能 的 GC 之 后 重新 加 载 jmon 对 象 

jmon = hndl->obj; 





// 被 一 个 解锁 monitor 的 线程 唤醒 
self->status = THREAD_STATE_RUNNING; 
self->blocked_lock = null; 
// 循环 回去 再 次 竞争 锁 

} 


free_local_obj_handle(hnd1) ; 


// 最 终 获得 锁 并 返回 
return; 


} 

使 用 局 部 对 象 句 柄 的 解决 方案 也 可 以 用 于 同步 Java 方 法 。 尽 管 Java 方 法 代码 没有 在 它 的 开 
端 设置 局 部 对 象 句柄 ， 这 个 新 创建 的 对 象 句柄 将 被 链接 到 一 个 对 象 句 柄 列表 中 ， 该 列表 由 当前 
Java 徐 指 针 指 向 的 上 一 个 本 地 帧 建立 。 然 后 在 vm_object_lock() 返 回 之 前 会 释放 它 。 

虽然 这 么 说 ， 但 实现 字 节 码 monitorenter 的 Java 代码 不 能 直接 调用 vm_object_lock(), 
JNI API K% MonitorEnter () 也 不 能 直接 调用 它 。 这 与 运行 时 辅助 设计 相关 , 第 10 章 会 讨论 这 
个 主题 。 
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9.5 ” ”Java 与 本 地 代码 转换 中 的 GC 支持 


前 文 已 经 介绍 了 Java 代码 中 和 本 地 代码 中 的 GC 支持 ， 剩 下 的 就 是 Java 和 本 地 代码 之 间 转 
换 相关 的 部 分 。 前 文 已 经 介绍 了 转换 的 过 程 。 这 里 是 从 GC 角度 来 看 的 一 个 总 结 。 


9.5.1 本 地 到 Java 


从 本 地 方法 调用 Java 方 法 时 ， 本 地 代码 通过 像 CallobjectMethoda 这 样 的 JNIAPI 来 调 
用 定义 在 Java 类 中 的 方法 。 然 后 这 个 方法 调用 API 会 调用 桥接 代码 (HI vm_execute_java_ 
method() ) 为 Java 方 法 调用 准备 栈 。 桥 接 代码 需要 解 封 引 用 参数 ， 并 把 对 象 引 用 压 栈 ， 其 中 包 
括 调用 的 目标 对 象 ( 对 于 静态 方法 就 是 声明 方法 的 类 ， 对 于 虚 方法 就 是 接收 对 象 )。 这 些 操作 会 
触 碰 对 象 , 是 非 GC 安全 的 , 所 以 JNIAPI 实现 应 该 在 调用 桥接 代码 vm_execute_java_method () 
之 前 离开 GC 安全 区 域 ， 在 调用 这 上段 桥接 代码 之 后 进入 GC 安全 区 域 。 我 们 需要 修改 桥接 代码 之 
前 的 实现 ,来 反映 输入 参数 对 象 句柄 解 封 和 引用 类 型 返回 值 封 箱 的 过 程 。 


void vm_execute_java_method( jmethodID* mid, 
jvalue* pargs, 
jvalue* ret) 


// 线程 在 调用 这 个 函数 之 前 离开 安全 区 域 


assert( !thread_in_saferegion() ); 


Method* method = (Method*)mid; 
// 参数 的 字数 (不 是 参数 个 数 ， 

// 因为 ]ong/double 有 两 个 字 ) 
char* desc; // 方法 描述 符 
java_type ret_type; // 返回 类 型 


method_get_param_info(method, &desc, &ret_type); 


// 处 理 输入 值 

uint32 nargs = 0; 

for(++desc; (*desc) != ‘')'; desc++) { 
java_type type = (java_type) *desc; 


switch( type ){ 
case JAVA_TYPE_CLASS: 
case JAVA_TYPE_ARRAY: 


// 就 地 解 封 引用 参数 

// 把 对 象 句 柄 替换 为 对 象 引 用 

Object_handle* hnd1; 

hndl = (Object_handle*)pargs[nargs]; 

pargs[nargs] = (jvalue) (hndl ? hndl->obj : NULL); 


while(type == ‘[‘) desc++; 
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Lit type s= “A J 

while( type != ‘;’ ) desc++; 
nargs++; 
break; 


case JAVA_TYPE_LONG: 
case JAVA_TYPE_DOUBLE: 
nargs+ = 2; 
break; 


default: 
nargs++; 


// 得 到 Java 方法 的 入 口 点 
void* java_entry = method_get_entry (method) ; 


uint32 eax, edx; // 返回 值 
native_to_java_call(java_entry, nargs, pargs, &eax, &edx); 


// 检查 是 否 有 任何 未 处 理 异 常 ， 清 除 返 回 值 
if (thread_get_pending_exception() ) { 





*ret = (jvalue)0; 
return; 
} 
// 处 理 返回 值 
if ( ret_type == JAVA_TYPE_VOID) return; 
((uint32*)ret) [0] = eax; 


// 第 二 个 字 只 用 于 long/double 类 型 
《LEE ret) [1] = edx; 


// REBRIMA, HAC 


if( ret_type == JAVA_TYPE_CLASS || 
ret_type == JAVA_TYPE_ARRAY ) 
{ 
if( eax != NULL ){ 


Object_handle* hndl = allocate_local_obj_handle(); 
hndl->obj = (Object*) eax; 
*ret = (jvalue)hndl; 


return; 


} 


桥接 代码 准备 的 栈 数据 是 Java 方法 的 输入 参数 ， 因 此 是 Java 栈 帧 的 一 部 分 。 这 个 方法 的 
GC-map 编码 了 引用 信息 。 位 于 输入 参数 之 前 的 栈 数据 可 能 包含 桥接 代码 的 非 安 全 代码 放 入 的 对 
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象 引用 。 尽 管 可 以 通过 精巧 地 设计 桥接 代码 来 避免 这 种 情况 , 但 实际 上 这 不 是 一 个 问题 ,因为 桥 
接 代码 放 在 栈 上 的 这 些 条 目 是 死 数据 , 没有 代码 会 再 次 访问 这 些 数据 。Java 代码 只 访问 它 的 方法 
帧 中 的 数据 ，Java 方法 返回 之 后 的 本 地 代码 只 会 访问 局 部 对 象 句柄 ， 包 括 从 Java 方法 返回 的 引 
用 值 。 


95.2 Java 到 本 地 


在 对 局 部 对 象 句柄 的 讨论 中 , 我 们 已 经 了 解 本 地 方法 通过 对 象 句柄 访问 对 象 。 任何 非 安全 访 
问 应 该 被 一 对 离开 和 进入 GC 安全 区 域 的 操作 保护 。Java 代码 在 栈 上 准备 好 参数 ， 然 后 调用 Java 
到 本 地 封装 代码 ， 它 会 为 本 地 方法 再 次 压 栈 参数 ， 其 中 引用 参数 被 封 箱 为 局 部 对 象 句 柄 。 封 装 代 
码 压 栈 的 项 目 之 前 的 栈 数 据 属于 前 一 个 Java 帧 ， 引 用 信息 在 它 (前 一 个 Java Wi) 的 GC-map 中 
维护 。 


Java 代码 调用 本 地 方法 之 前 , 在 它 的 调用 指令 处 有 一 个 GC 安全 点 ， 然 后 这 个 调用 指令 执行 
后 ，GC 安全 性 状态 变 为 非 安 全 ， SERO E 封装 代码 就 在 调用 本 地 方法 之 
前 ,以 及 准备 好 局 部 对 象 句柄 之 后 ， 把 GC 安全 状态 变 回 安全 的 。 对 本 地 方法 的 调用 返回 到 封装 
代码 后 ，GC 安全 性 就 变 回 非 安全 。 如 果 返 回 值 为 对 象 引 用 ， 封 装 代码 会 解 封 它 ， 然 后 把 这 个 对 
象 引 用 放 到 Java 方 法 的 返回 寄存 天 中 。 


9.5.3 ”本 地 到 本 地 


这 是 本 地 方法 使 用 JNIAPI 调用 另 一 个 本 地 方法 的 情况 。 尽 管 看 起 来 这 只 涉及 本 地 方法 ， 但 
实际 上 这 个 转换 是 从 本 地 到 Java， pas Java 到 本 地 的 过 程 。 换 名 话说 ， 这 是 上 面 两 种 情况 
的 组 合 。 这 对 GC 的 影响 与 简单 组 合 又 有 些 区 别 。 


在 本 地 到 Java 转换 中 ， 本 地 帧 中 由 桥接 代码 压 栈 的 对 象 引用 值 会 被 忽略 ， 因 为 这 些 引用 参 
数 会 为 Java 帧 被 重新 压 栈 ， 并 且 如 果 目 标 真 的 是 Java 方 法 的 话 ， 会 被 Java 帧 的 GC-map 记录 。 
如 果 目 标 不 是 Java 方 法 ,那么 控制 继续 进入 Java 到 本 地 转换 ， 为 本 地 方法 调用 这 些 参 数 会 被 再 
一 次 重新 压 栈 ， 并 用 局 部 对 象 句柄 封 箱 。 

当 发 生 GC 时 , 可 以 通过 局 部 对 象 句柄 枚 举 引 用 参数 , 那些 在 Java 到 本 地 封装 代码 之 前 被 
压 栈 的 参数 都 被 忽略 ， 因 为 它们 不 再 有 用 了 ， 如 图 9-4 所 示 。 图 中 还 是 以 前 面 的 应 用 程序 代码 
为 例 。 
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图 9-4 ”转换 帧 中 的 栈 数据 
本 地 方法 处 于 安全 区 域 。 当 它 调用 Java 方 法 的 时 候 ， 本 地 到 Java 转换 在 调用 之 前 离开 安全 
区 域 。 当 它 遇 到 Java 到 本 地 封装 时 ，GC 安全 性 状态 在 调用 本 地 方法 之 前 被 设 为 安全 区 域 。 返 回 
路 径 代码 所 做 的 恰好 与 之 相反 。 通 过 这 种 方式 保证 了 GC 安全 不 变性 ， 如 图 9-5 所 示 。 
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图 9-5 跨 转 换 的 GC 安全 不 变性 维护 
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9.6 全 局 根 集 


VM 维护 了 很 多 全 局 数据 结构 ， 其 中 可 能 持 有 活跃 对 象 。 它 们 不 一 定 能 从 线程 局 部 根 引用 到 
达 ， 应 该 在 GC 过 程 中 单独 枚 举 。 

O 类 加 载 器 : 除了 自 举 类 (bootstrap class ) 加 载 器 ，VM 还 可 能 有 额外 的 自 定义 类 加 载 器 。 
如 果 VM 不 支持 类 伸 载 的 话 ， 那 么 所 有 自 定 义 类 加 载 器 ， 包 括 它们 加 载 的 类 ， 都 应 该 被 
BE. WR VM 支持 类 件 载 ,那么 不 应 该 把 类 加 载 器 枚 举 为 根 ， 因 为 类 加 载 器 的 活性 应 
该 由 它 加 载 的 类 活性 的 可 达 性 定义 。 如 果 任 何 由 它 定义 的 类 都 是 活跃 的 ， 那 么 这 个 类 加 
载 器 就 是 活跃 的 。 

口 类 : 由 自 定 义 类 加 载 器 加 载 的 类 ， 用 和 上 面 类 似 的 方式 对 待 。 一 个 类 只 有 在 有 活跃 对 象 
实例 或 者 在 栈 上 有 活跃 方法 的 时 候 ， 这 个 类 才 是 活跃 的 。 因 此 ， 如 果 VM 支持 类 负载， 
就 不 用 枚 举 类 。 和 否则 就 应 该 枚 举 它们 。 即 使 是 因为 支持 卸载 ， 所 以 类 没有 被 枚 举 为 根 ， 
它们 也 应 该 被 枚 举 为 弱 根 ， 这 样 才能 在 它们 不 可 达 的 时 候 处 理 它们 。 

可 能 会 有 一 些 用 异常 对 象 表示 的 解析 错误 ， 保 存在 类 数据 结构 中 。 这 种 情况 下 它们 也 应 
该 被 枚 举 。 所 有 由 自 举 类 加 载 器 定义 的 类 ， 包 括 它 们 的 静态 引用 字段 ， 也 都 应 该 被 枚 举 。 

口 全 局 对 象 句柄 : 它们 使 被 引用 的 对 象 保 持 活跃 ， 应 该 被 添加 到 根 集中 。 

O 待 终结 (finalize) MR: 有 终结 器 (finalizer ) 要 执行 的 不 可 达 对 象 应 该 被 枚 举 ， 以 避免 
被 垃圾 回收 。 第 12 章 将 讨论 这 一 主题 。 

口 竺 入 队 的 弱 引用 对 象 : 如 果 弱 引用 一 族 对 象 的 所 指 是 不 可 达 的 ， 这 些 弱 引用 对 象 会 被 入 
队 。 它 们 应 该 在 入 队 之 前 被 枚 举 。 第 12 章 会 讨论 这 些 细节 。 

O HEFE (interned string) : 驻 留 字符 串 在 VM 中 托管 ， 这 样 同样 的 字符 串 字面 值 能 
用 同一 个 字符 串 对 象 表示 。 它 们 更 像 是 缓存 的 备份 ， 不 一 定 要 单独 枚 举 为 根 ， 因 为 它们 
的 活性 由 从 活跃 对 象 的 可 达 性 来 定义 。 但 是 和 类 外 载 一样 ， 如 果 VM 想 要 回收 驻 留 字符 
串 ， 那 么 也 应 该 把 它们 枚 举 为 弱 根 。 


在 多 数 VM 实现 中 , 驻 留 字符 串 不 会 被 回收 , 因为 它们 的 生存 期 与 其 他 对 象 的 生存 期 不 太一 
样 。 当 运行 中 应 用 程序 的 某 个 类 有 某 个 字符 串 字 面值 的 时 候 , 对 应 的 驻 留 字符 串 可 以 被 认为 是 活 
路 的 。 换 句 话 说 ,字符 串 字 面值 被 看 作 一 个 活跃 “引用 ”"， 尽 管 直到 包含 它 的 类 被 加 载 后 它 才 是 
活跃 的 。 


1088 运行 时 辅助 





现在 你 已 经 了 解 了 Java 代码 与 本 地 代码 之 间 的 转换 。 在 进一步 讨论 虚拟 机 ( VM ) 运行 中 的 
控制 流转 换 ， 特 别 是 异常 抛 出 之 前 ， 这 里 值得 先 讨 论 一 下 运行 时 辅助 ( runtime-helper )。 


10.1 为 何 需要 运行 时 辅助 


在 Java 虚拟 机 (JVM) 中 ,根据 使 用 的 语言 ， 大 体 上 可 分 为 两 种 运行 代码 : Java 代码 和 本 
地 代码 。 前 文 已 经 介绍 过 ， 实 际 情况 要 比 这 种 划分 更 复杂 一 些 。 下 面 是 在 JVM 中 运行 的 不 同类 
型 代码 的 一 个 总 结 。 这 里 假定 VM 与 本 地 方法 用 同一 种 语言 开发 。 稍 后 会 讨论 它们 不 使 用 同一 种 
语言 的 情况 ， 但 关键 概念 仍然 不 变 。 

O Java 代码 ( 字 节 码 ) : JVM 的 唯一 目的 就 是 运行 Java 编写 的 应 用 程序 。 更 精确 的 表述 是 

运行 Java 类 文件 ， 因 为 JVM 是 看 不 到 Java 代码 的 。 

O 本 地 方法 : 本 地 方法 代码 可 能 来 自 应 用 程序 ， 也 可 能 来 自 VMs VM 需要 实现 一 些 紧 密 
依赖 于 VM 内 部 实现 的 内 建 本 地 方法 ， 比 如 需要 支持 java.1lang.reflect、java.1lang. 
System 等 。 本 地 方法 是 垃圾 回收 (GC) 安全 的 。 

口 VM 代码 : VM 实现 中 最 主要 的 本 地 代码 不 是 本 地 方法 代码 ， 而 是 其 他 支持 组 件 ， 比 如 
即时 (JIT) 编译 器 、 垃 圾 回收 融和 线程 库 。 它 们 可 以 在 平台 级 执行 所 有 底层 操作 ， 而 不 
需要 担心 Java 的 安全 性 和 可 移植 性 需求 。 实 际 上 ，VM 代码 是 安全 语言 与 底层 平台 之 间 
的 胶水 层 ， 底 层 平台 通常 是 非 安全 的 。 

以 上 3 种 代码 构成 了 JVM 内 运行 代码 的 主体 ,它们 在 调用 惯例 、GC 安全 性 和 平台 访问 方面 
具有 不 同 的 性 质 ， 因 此 Java 代码 、 本 地 方法 和 VM 代码 不 能 简单 地 彼此 调用 。 它 们 不 得 不 依赖 
于 以 下 几 种 额外 的 代码 类 型 或 组 件 才能 彼此 合作 。 

O Java 本 地 接口 ( JNI) 函数 (JNIAPI ) : 这 些 函 数 向 本 地 方法 提供 API 来 访问 Java 世界 ， 

并 保持 安全 语言 属性 ， 比 如 调用 Java 方 法 、 抛 出 异常 ,或 者 用 monitor 同步 。JNI 函数 遵 
循 本 地 方法 编程 规则 ， 除 了 它们 可 以 有 非 GC 安全 操作 。 

O 胶水 代码 : 胶水 代码 是 指 用 于 控制 流转 换 或 操纵 的 代码 。 例 如 ， 本 地 到 Java 桥接 代码 和 

Java 到 本 地 封装 代码 都 是 胶水 代码 。 它 们 可 以 用 汇编 代码 ( 或 手写 机 器 码 ) 编写 。 当 VM 想 


要 精确 控制 栈 或 奇 存 器 操作 的 时 候 ， 汇 编 代码 很 有 用 。 有 时 也 为 了 性 能 而 使 用 汇编 语言 。 
口 硬件 异常 处 理 函数 ( 或 信号 处 理 函 数 )， 当 硬件 异常 发 生 时 ， 操 作 系统 会 调用 注册 的 处 理 
函数 。 在 本 地 代码 和 Java 代码 中 都 可 能 发 生 异 常 ， 而 异常 处 理 函 数 都 用 本 地 代码 编写 。 


胶水 代码 是 必要 的 。( 用 本 地 语言 编写 的 ) 本 地 世界 由 本 地 编译 器 编译 ，( 用 Java 字 节 码 编 
写 的 ) Java 世界 由 JIT 编译 靛 编译。 通常 ， 这 两 个 编译 带 对 彼此 一 无 所 知 。 如 果 要 把 控制 从 一 个 
世界 转 和 人 另 一 个 世界 ， 就 需要 胶水 代码 。VM 开发 者 不 应 该 也 不 能 够 假定 两 个 世界 的 调用 惯例 相 
同 。 至 少 在 Java 调用 本 地 代码 时 ， 对 象 引用 不 会 自动 装 箱 为 对 象 句柄 ; 在 本 地 代码 调用 Java 代 
码 时 ， 对 象 引用 也 不 会 自动 从 对 象 句柄 解 封 。( 所 以 很 容易 理解 ， 即 使 是 基于 解释 器 的 VM， 也 
几乎 无 法 避免 手写 机 需 码 。) 

很 多 情况 下 都 会 发 生 Java 世界 与 本 地 世界 的 转换 ， 不 仅 限 于 显 式 方法 调用 的 情况 。 只 要 潜 
在 的 跨 界 转换 可 能 发 生 ， 胶 水 语言 就 是 必要 的 。 

前 面 已 经 提 到 过 , 可 以 认为 VM 代码 提供 了 被 称 为 VM 服务 的 运行 时 服务 。Java 代码 和 本 地 
方法 是 这 些 服务 的 客户 。Java 代码 需要 胶水 代码 来 访问 VM 服务 。 本 地 方法 需要 INI API ( INI 
PRA) 来 访问 VM 服务 。 从 Java 代码 到 VM 服务 的 胶水 代码 被 称 为 “运行 时 辅助 >。 图 10-1 展示 
了 不 同 代码 类 型 之 间 的 关系 。 


Java 字 市 码 (编译 后 ) 








图 10-1 不 同类 型 代码 之 间 的 调用 关系 
在 这 个 调用 关系 图 中 ， 几 乎 所 有 的 调用 都 是 从 Java 代码 到 本 地 代码 方向 ， 只 有 一 种 情况 是 
反方 向 的 , 那 就 是 本 地 到 Java 桥接 代码 ,本 地 到 Java 桥接 只 需要 一 段 代 码 , 即 函数 vm_execute_ 
java_method()。 这 是 合理 的 ， 因 为 VM 是 用 来 支持 Java API 和 语义 的 ， 而 不 是 反 过 来 。 
到 目前 为 止 , 本 书 已 经 介绍 ( 有 时 是 概述 ) 了 几乎 所 有 代码 类 型 的 实现 ,还 剩 下 运行 时 辅助 
和 硬件 异常 处 理 函 数 ， 本 章 和 下 一 半 将 分 别 讨论 这 两 个 主题 。 
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10.2” 带 运行 时 辅助 的 VM 服务 设计 
Java 代码 执行 的 过 程 中 需要 访问 各 种 VM 服务 。 以 下 列举 了 一 些 需 要 VM 服务 的 例子 。 
口 Java 字 节 码 调用 一 个 Java 方 法 (invoke 系列 ) ， 而 后 者 还 没有 编译 。 那 么 这 次 调用 会 触 
发 VM 调用 “编译 占 ” 来 即时 编译 这 个 Java 方法 。 被 调用 方法 原来 的 入 口 点 实际 上 是 一 
段 跳板 代码 ， 用 来 触发 目标 方法 编译 ， 然 后 跳 转 到 编译 后 代码 中 。 (这 实际 上 与 本 地 代 
码 相 同 ， 那 种 情况 下 编译 器 并 不 编译 到 二 进 制 代 码 ， 而 是 生成 Java 到 本 地 封装 代码 作为 
编译 结果 。 ) 

口 Java 字 节 码 执行 monitor 代码 (monitorenter 或 monitorexit ) ， 这 可 能 会 涉及 线程 

阻塞 和 唤醒 操作 。“ 线 程 化 ”需要 底层 平台 的 相关 服务 ， 只 能 在 本 地 代码 中 执行 。 

O Java 字 节 码 创建 一 个 新 对 象 或 数组 (new 系列 ) 。 这 个 操作 可 能 会 因 空闲 推 空间 不 足 而 

触发 “垃圾 回收 ”。 于 是 运行 必须 陷入 VM 获得 服务 。 

O Java 字 节 码 抛 出 “异常 ”(athrow ) 。 这 需要 依赖 于 VM 代码 找到 匹配 的 处 理 需 

( handler ) ， 过 程 可 能 涉及 栈 展开 和 控制 流转 移 。 其 他 可 能 抛 出 异常 的 Java FAU fa 
陷入 VM 代码 。 

当 Java 代码 执行 需要 VM 服务 的 时 候 ， 会 调用 一 个 运行 时 辅助 ， 帮 助 把 控制 从 Java 世界 转 
移 到 本 地 世界 。 在 某 种 程度 上 ,运行 时 辅助 类 似 于 操作 系统 设计 中 的 系统 调用 ,提供 在 用 户 空 间 
不 可 用 的 内 核 服务 。 这 里 的 内 核 就 是 VM 代码， 用户 空间 就 是 Java 世界 。 

记 住 了 这 个 类 比 , 就 很 容易 理解 VM 为 何 只 需要 提供 少数 的 运行 时 服务 一 一 这 些 运 行 时 服务 
具有 代表 性 ， 并 概括 了 所 有 必需 的 VM 服务 。 例 如 ， 异 党 抛 出 是 VM 提供 的 一 个 服务 。VM 不 需 
要 为 每 个 可 能 抛 出 异常 的 Java 字 节 码 都 提供 一 个 运行 时 服务 .这 些 字 节 码 只 需要 调用 同一 个 VM 
服务 来 抛 出 异常 。 


10.2.1 ”运行 时 辅助 操作 


为 了 设计 运行 时 辅助 , 首先 要 理解 的 是 , 为 什么 不 把 VM 服务 作为 本 地 方法 来 开发 。 如 果 可 

以 把 它们 开发 为 本 地 方法 , 那么 就 不 需要 为 运行 时 辅助 编写 专门 的 代码 了 。 本 地 方法 有 统一 的 访 

问 机 制 。 换 句 话 说 , 就 像 所 有 的 内 核 服务 使 用 统一 的 系统 调用 机 制 一 样 。 这 是 可 能 的 , 但 没有 必 

要 ， 主 要 是 由 于 VM 设计 中 的 性 能 原因 。 用 于 本 地 方法 访问 的 运行 时 辅助 是 Java 到 本 地 封装 代 

fy, 与 普通 Java 方 法 调用 相 比 ， 多 了 些 额 外 的 操作 。 并 非 每 一 个 VM 服务 都 需要 所 有 这 些 操作 。 
(1) 下 面 的 操作 是 GC 和 异常 处 理 都 需要 的 ， 因 为 VM 不 知道 本 地 编译 器 如 何 布局 栈 帧 。 

O 被 调用 方 保存 寄存 器 : 封装 代码 需要 压 栈 所 有 被 调用 方 保 存 寄存 器 。 在 编译 后 的 Java 代 

码 中 ， 压 栈 哪些 寄存 髓 依赖 于 JIT 编译 器 的 决定 。 对 一 个 由 本 地 编译 器 编译 的 本 地 方法 

来 说 ， 本 地 编译 器 会 使 用 哪些 被 调用 方 保存 寄存 器 是 未 知 的 。 其 中 有 些 可 能 持 有 对 象 引 

用 ,需要 在 GC 过 程 中 枚 举 ， 所 以 VM 需要 把 它们 放 在 一 个 已 知 的 位 置 。 本 地 方法 返回 
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时 ， 封 装 代码 还 会 通过 弹 栈 恢复 所 有 的 被 调用 方 保存 寄存 器 。 

O Java 簇 指针 链 : 在 栈 展 开 的 时 候 ，VM 需要 通过 Java 簇 指 针 绕 过 传统 C 帧 。 它 需要 为 当 
前 本 地 方法 在 调用 前 后 维护 这 个 链 。 

(2) 为 了 在 本 地 方法 中 支持 GC, 需要 以 下 操作 。Java 代码 是 非 GC 安全 的 ， 所 以 它 可 以 直接 
访问 对 象 ， 而 在 本 地 代码 中 这 是 不 允许 的 。 

口 局 部 对 象 句柄 : 封装 代码 需要 为 当前 本 地 方法 创建 局 部 对 象 句柄 ， 这 样 这 个 本 地 方法 才 
能 访问 Java 对 象 。 即 使 这 个 本 地 方法 并 不 访问 任何 Java 对 象 ， 这 样 做 也 是 必需 的 ， 因 为 
VM 对 本 地 方法 内 部 一 无 所 知 ， 并 且 实 际 上 本 地 方法 在 其 参数 中 至 少 有 一 个 Java 对 象 。 

O 参数 和 返回 值 封 箱 / 解 封 : 如 果 本 地 方法 有 引用 参数 ， 封 装 代码 需要 把 它们 封 箱 为 局 部 对 
象 句 柄 ， 然 后 在 本 地 方法 返回 的 时 候 释 放 这 些 局 部 对 象 句柄 ， 以 此 清理 这 些 引 用 ( 如 果 
对 象 句柄 不 在 栈 上 分 配 的 话 ， 也 避免 了 内 存 泄露 )。 如 果 本 地 方法 返回 一 个 引用 值 ， 封 装 
代码 还 需要 解 封 它 以 允许 Java 世界 访问 ， 因 为 本 地 方法 返回 的 是 一 个 对 象 句柄 。 

O 打开 /关闭 GC: 封装 代码 需要 在 调用 本 地 方法 之 前 进入 安全 区 域 ， 调 用 之 后 需要 离开 安 
全 区 域 ， 因 为 Java 代 码 是 非 GC 安全 的 ， 而 本 地 方法 是 GC 安全 的 。 这 是 本 地 方法 语义 的 
需求 。 

(3) 如 果 JIT 编译 器 和 本 地 编译 器 调用 惯例 不 同 的 话 ， 需 要 以 下 操作 。 

O 再 次 准备 参数 : 如 果 JIT 编译 器 以 从 左 到 右 顺 序 压 栈 方法 参数 ， 封 装 代码 需要 遵循 C pK 
数 顺 序 ， 从 右 到 左 再 次 压 栈 参数 。 

(4) 因为 VM 对 本 地 方法 执行 一 无 所 知 ， 所 以 需要 以 下 操作 。 

口 异常 : 封装 代码 应 该 处 理 任 何 未 处 理 异 常 。 这 些 异 常 可 能 由 本 地 方法 抛 出 ， 也 可 能 是 从 
它 调用 链 中 的 某 个 被 调用 者 传递 过 来 。 生 成 封装 代码 的 时 候 ，VM 并 不 了 解 这 个 本 地 方 
法 执行 是 否 会 抛 出 任何 异常 。 它 必须 检查 ， 并 根据 结果 处 理 ( 第 11 章 将 介绍 这 一 话题 )。 

以 上 所 有 额外 操作 对 于 运行 时 辅助 并 非 都 是 必需 的 。 尽管 VM 服务 由 本 地 编译 器 编译 , 但 它 

们 的 代码 对 于 VM 是 已 知 的 , 因为 它们 是 VM 代码 的 一 部 分 。 那 么 就 有 可 能 省 略 某 些 操作 来 提高 
VM 服务 的 性 能 , 因此 也 加 速 了 Java 代码 的 执行 速度 。 举 例 来 说 ， 如 果 我 们 知道 某 个 VM 服务 不 
会 访问 Java 对 象 ， 就 不 需要 在 它 的 运行 时 辅助 中 创建 局 部 对 象 句柄 。 如 果 我 们 知道 某 个 VM 服 
务 会 快速 完成 ， 不 会 引发 GC 也 不 会 抛 出 异常 ,那么 它 的 运行 时 辅助 就 不 需要 打开 /关闭 GC, 或 
者 维护 Java 秘 指 针 链 ， 等 等 。 接 下 来 用 几 个 例子 来 讨论 运行 时 辅助 实现 。 


10.2.2 ”运行 时 辅助 实现 


如 果 monitor 对 象 引用 为 null， 那 么 字 节 码 monitorentry 会 抛 出 一 个 异常 。 和 否则 就 继续 
前 进 ， 锁 住 这 个 monitors 


JIT 编译 顺 可 能 为 monitorenter 生成 如 下 代码 ( 伪 代 码 )。 
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// obj 是 要 enter 的 monitor 


if( obj == NULL ) { 
runtime_throw_exception("NullPointerException") ; 
jelse{ 


runtime_monitor_enter (obj); 
} 


在 这 段 概 念 代 码 中 , JIT 生成 了 对 两 个 不 同 的 运行 时 辅助 的 调用 。 一 个 是 runtime_throw_ 


exception() ， 另 一 个 是 xuntime_monitor_enter()。 


尽管 VM 已 经 实现 了 用 于 锁 住 一 个 非 空 monitor 的 vm_object_lock(), 但 JIT 不 能 生成 直 
接 调 用 它 的 代码 。 原因 是 ， 如 果 这 个 monitor BACAR BEA. PAE vm_object_lock() 可 能 会 
阻塞 在 lock_blocking() 上 。 对 vm_object_lock() 的 调用 必须 支持 GC， 这 样 阻 寨 的 线程 就 
不 会 妨碍 GC 发 生 。 为 此 ,我们 使 用 了 一 个 运行 时 辅助 runt ime_monitor_enter () 来 执行 以 
下 3 有 段 工作 。 

O 保存 /恢复 被 调用 方 保存 寄存 器 ， 这 样 在 GC 发 生 时 ， 可 以 枚 举 和 更 新 保存 在 这 些 被 调用 

方 保存 寄存 器 中 的 对 象 引 用 。 
Q ee cui Java 徐 指 针 链 ， 这 样 可 以 枚 举 栈 上 所 有 的 根 引用 。 
口 这 个 运行 时 辅助 还 需要 再 压 栈 参数 。 


运行 时 辅助 不 需要 打开 /关闭 GC， 因 为 vm_object_lock() 不 是 本 地 方法 ， 而 是 一 个 
纯 C 是 非 GC 安全 的 。 在 内 部 ， 它 会 在 线程 休眠 等 待 锁 之 前 打开 GC， 并 在 线程 休眠 之 之 后 
关闭 GC。 


它 不 会 封 箱 / 解 封 引用 参数 和 返回 值 , 因为 引用 参数 会 在 vm_object_lock () 中 封 箱 。 因此 ， 
这 个 运行 时 辅助 也 不 需要 创建 局 部 对 象 句柄 。 如 果 vm_object_lock() 需 要 局 部 对 象 句柄 ， 它 
可 以 在 需要 的 时 候 创建 。 


runtime_monitor_enter () 的 伪 代 码 如 下 所 示 。 


void runtime_monitor_enter(Object* obj) 
{ 
__asm { 
// 首先 保存 被 调用 方 保存 寄存 器 
push ebp 
Push ebx 
Push esi 
push edi 


// 局 部 对 象 句 枉 的 头 指 针 占 位 符 
push 0 


// 38 ARAB A 

call get_address_of_cluster_pointer 
push eax 

push [eax] 

mov esp -> [eax] 








// 再 次 压 栈 本 地 方法 参数 
push [esp+size M2N wrapper] // FRR obj 


call vm_object_lock 


// 恢复 Java RASH 
pop ecx 
pop ebx 
mov ecx -> [ebx] 


// 恢复 被 调用 方 保存 寄存 器 
pop edi 

pop esi 

pop ebx 

pop ebp 

// 返回 并 弹出 Java 参数 (obj) 


ret 4 


} 
调用 vm_object_lock() 前 后 的 加 粗 代 码 体 ， 实 际 上 对 于 所 有 类 似 的 运行 时 辅助 都 是 一 样 
的 ， 因 此 可 以 把 它们 放 在 一 个 代码 生成 器 或 者 安里 , 在 需要 的 时 候 生 成 同样 的 序列 。 可 以 把 它们 
看 作 在 栈 上 压 栈 /弹出 M2N_wrapper 数据 结构 。 然 后 模块 化 的 runtime_monitor_enter () 4N 
下 所 示 。 
void __stdcall runtime_monitor_enter(Object* obj) 
{ 
__asm{ 
// M2N_wrapper 处 理 使 用 宏 
push_M2N wrapper 
// 再 压 栈 本 地 方法 参数 
push [esp+size_M2N_wrapper] // 压 栈 obj 
call vm_object_lock 


pop_M2N_ wrapper 
ret 4 


t 
J 


一 个 问题 是 ， 正 如 我 们 之 前 看 到 的 ， 为 什么 在 同步 方法 开端 直接 调用 vm_object_lock () 
不 是 个 问题 。 原因 在 于 , 同步 方法 的 GC 支持 已 经 被 准备 好 了 一 一 如 果 是 Java 方 法 就 是 由 JIT 编译 
需 准 备 的 , 如 果 是 本 地 方法 的 话 就 是 由 Java 到 本 地 封装 代码 准备 的 。 不 需要 为 vm_object_lock () 
再 单独 准备 一 次 





10.2.3 JNIAPI 作为 运行 时 辅助 

INI 函数 也 为 本 地 方法 访问 VM 服务 提供 了 API。 类 比 于 向 Java 代码 提供 VM 访问 的 运行 时 
辅助 , 可 以 把 INT 函数 看 作为 本 地 代码 提供 的 运行 时 辅助 。 与 Java 代码 访问 的 区 别 是 , 本 地 代码 
调用 JNI 函数 的 时 候 ， 代 码 处 于 GC 安全 区 ， 并 且 引 用 参数 已 经 被 封 箱 到 局 部 对 象 句 柄 中 


10.3 没有 运行 时 辅助 的 VM 服务 设计 151 


例如 ，JNI PAŽE MonitorEnter 作为 JNIAPI 提 供给 本 地 代码 使 用 。 


jint JNICALL MonitorEnter(JNIEnv * jenv, jobject jobj) 


由 于 本 地 代码 与 Java 代码 有 不 同 的 假设 条 件 ， 它 访问 VM 代码 vm_object_lock () 的 方式 
WAY ASA], JNI KZ MonitorEnter 需要 做 的 是 离开 安全 区 并 解 封 引 用 参数 。 下 面 是 示例 代码 。 


jint JNICALL MonitorEnter(JNIEnv * jenv, jobject jobj) 
{ 








if ( ExceptionCheck() ) 
return -1; 


vm_leave_saferegion(); 

Object* obj = (Object_handle) job->obj; 
vm_object_lock(obj); 
vm_enter_saferegion(); 


return 0; 
} 


因为 MonitorEnter() 也 是 一 个 本 地 方法 , 所 以 如 果 不 在 意 性 能 的 话 , 可 以 用 它 来 实现 Java 
FIG monitorenter. 这 样 就 不 需要 专门 的 运行 时 辅助 runtime_monitor_enter() 了 ,Java 
代码 也 可 以 通过 标准 Java 到 本 地 封装 调用 本 地 方法 MonitorEnter ()。 前 面 已 经 提 到 ， 由 于 输 
入 参数 不 同和 目标 本 地 方法 不 同 ， 实 际 上 需要 为 每 个 本 地 方法 生成 Java 到 本 地 封装 代码 。 所 以 
统一 使 用 封装 代码 并 不 能 为 VM 节省 运行 时 辅助 代码 .区 别 只 在 于 统一 封装 代码 是 由 VM 自动 生 
成 的 ， 而 专门 的 运行 时 辅助 是 由 开发 者 手动 开发 的 ， 性 能 更 好 。 
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VM 服务 的 另 一 个 例子 是 对 Java 字 节 码 instanceof 的 支持 。 它 检查 给 定 对 象 是 否 为 指定 
类 的 一 个 实例 。 它 在 VM 代码 中 实现 为 vm_instanceof ()。 
int __stdcall vm instanceof (Object *obj, Class *clss) 
{ 
EU obj == NULL } return 0; 
Class* sub = class_of_object (obj); 
bool is_subtype = class_is_subtype(sub, clss); 


return is_subtype; 


} 


bool class_is_subtype(Class *sub, Class *clss) 
{ 


if(sub == élss) return TRUE; 
if( class_is_array(sub) ) { 
if ( clss == class_java_lang_Object | | 
clss == class_java_io_Serializable || 
clss == class_java_lang_Cloneable_ Class) 


return TRUE; 
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if( !class_is_array(clss) ) return FALSE; 


sub = class_of_array_element( sub ); 
clss = class_of_array_element( clss ); 
return class_is_subtype(sub, clss); 


} else { // Af array 
if( !class_is_interface(clss) ) { 
sub = class_get_super_class (sub); 
do{ 
ift sub == clss } Eeturn TRUE? 
sub = class_get_super_class (sub); 
}while (sub); 


}else{ // # interface 
do{ 
unsigned n_intf = number_of_interfaces (sub); 


for(unsigned i = 0; i < n_intf; i++) { 
Class* intf = class_get_interface(i); 
if( class_is_subtype(intf, clss)) { 





return TRUE; 
} 
} 
sub = class_get_super_class (sub); 
}while (sub); 
} // interface 
} // array 


return FALSE; 
} 


可 以 看 到 vm_instanceof () 是 一 个 不 抛 出 异常 .不 触发 GC 也 不 阻塞 的 函数 。 它 是 一 个 VM 
服务 ， 因 为 它 的 实现 依赖 于 VM 实现 细节 。 

这 个 函数 是 非 GC 安全 的 ， 类 似 于 Java 代码 。Java 代码 可 以 不 通过 运行 时 辅助 直接 调用 它 ， 
只 要 JIT 编译 需 准 备 好 输入 参数 就 好 。 为 了 保持 路 平台 的 调用 惯例 一 致 ， 与 其 他 VM 服务 一 样 ， 
wm_instanceof() 被 修改 为 带 _、 stdcal1l 修饰 。 

不 使 用 专门 运行 时 辅助 的 好 处 是 可 以 省 去 辅助 中 额外 工作 带 来 的 运行 开销 ,还 可 以 为 VM FF 
发 者 节省 很 多 相应 的 编程 和 维护 精力 。 

H JIT 编译 器 来 为 instanceof 生成 实现 与 vm_instanceof () 逻 辑 相同 的 整个 代码 序列 也 
是 可 以 的 。 那样 的 话 ， 似 乎 不 必 陷 入 到 VM 服务 。 但 这 并 不 会 改变 这 个 代码 序列 的 性 质 ， 它 仍 是 
VM 逻辑 的 一 部 分 ， 因 为 它 肯定 不 是 Java 应 用 程序 / 库 代 码 的 一 部 分 ， 也 不 属于 编译 器 逻辑 。 它 
仍然 是 由 VM 开发 者 编码 ， 并 作为 编译 需 的 内 在 服务 (intrinsics ) 部 分 提供 。 但 它 与 真正 的 编译 
需 内 在 服务 的 关键 区 别 在 于 ， 这 段 代 码 的 逻辑 依赖 于 VM 实现 。 例 如 ，VM 如 何 从 对 象 中 提取 类 
指针 ，VM 如 何 从 数组 类 中 获得 元 素 类 ， 等 等 。 

另 一 方面 ，vm_instanceof () 仍然 需要 编译 器 来 生成 它 的 机 需 码 ， 用 于 运行 时 执行 。 
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vm_instanceof () 并 不 一 定 要 用 C 语言 编码 ， 可 以 使 用 任何 允许 编写 VM 服务 的 语言 。 如 果 VM 
IE Java JIT 编译 器 了 解 的 IR ( intermediate representation, 中 间 表 示 ) Je 
那么 JIT 编译 器 可 以 把 这 段 短小 却 又 频繁 执行 的 服务 代码 内 联 到 编译 好 的 Java 代码 中 , 这 样 可 以 
显著 提高 性 能 


10.3.1 行 时 辅助 的 快速 路 径 


基于 对 vm_instanceof () #l runtime_monitor_enter () AWE, 为 了 提高 性 能 , 我 们 可 
以 考虑 一 种 尽 可 能 直接 调用 VM 服务 的 方式 。 

对 于 可 能 触发 GC、 抛 出 异常 或 阻塞 的 VM 服务 ， 为 了 提高 性 能 ， 一 种 直观 的 常用 实践 就 是 
把 运行 分 割 为 快速 路 径 和 慢 速 路 径 。 快速 路 径 不 需要 运行 时 辅助 ,而 带 运行 时 辅助 的 慢 速 路 径 处 
理 GC 和 异常 支持 的 额外 工作 。 运 行 首先 走 没有 运行 时 辅助 的 快速 路 径 ， 只 有 在 快速 路 径 不 可 行 
的 情况 下 才 执 行 慢 速 路 径 。 下 面 是 划分 标准 。 


口 快速 路 径 不 触发 异常 抛 出 和 垃圾 回收 ， 也 永远 不 会 阻塞 。 
口 快速 路 径 是 目标 VM 服务 的 固有 部 分 。 
口 快速 路 径 是 VM 服务 大 多 数 调用 的 共同 路 径 。 
口 如 果 快 速 路 径 成 功 返回 ， 就 不 会 走 慢 速 路 径 。 
以 vm_object_lock() 为 例 , 这 里 快速 路 径 可 以 是 monitor 空 闲 并 成 功 锁定 的 情况 ， 而 慢 速 
路 径 处 理 所 有 的 其 他 情况 。 可 以 把 runtime_monitor_enter() 代 码 修改 如 下 。 


void runtime_monitor_enter(Object* obj) 
{ 
// 先 走 快速 路 径 
__asm{ 
push [esp+4] // ÆR obj 
call lock_non_blocking 
test eax eax 
jz FAILED 
ret 4 
FAILED: 
// 如 果 快 速 路 径 失 败 ， 走 慢 速 路 径 
push_M2N_wrapper 
// 再 次 压 栈 本 地 方法 参数 
push [esp+size_M2N_wrapper] // 压 栈 obj 
call vm_object_lock 
pop_M2N_wrapper 
ret 4 
} 
} 


如 果 成 功 进 入 空闲 monitor 是 常见 的 情况 , 那么 这 个 新 实现 可 以 显著 提高 大 量 Java 应 用 程序 
的 性 能 。 注意 快 速 路 径 仍然 可 以 调用 VM 服务 困 数 ， 只 要 这 些 VM 服务 不 会 导致 垃圾 回收 、 异 常 
或 阻塞。 
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10.3.2 RRR VM 服务 编程 


VM 服务 快速 路 径 预 期 被 高 频 执行 。 既 然 快速 路 径 的 代码 用 本 地 语言 开发 ,那么 需要 一 次 从 
编译 后 Java 代码 到 编译 后 本 地 服务 代码 的 调用 。 这 样 做 并 不 高 效 。 比 较 好 的 做 法 是 把 快速 路 径 
代码 编译 为 JIT 编译 器 了 解 的 同一 种 中 间 语 言 ， 这 样 就 可 以 把 快速 路 径 内 联 到 编译 后 Java 代码 
中 ， 并 可 以 采用 更 多 编译 优化 技术 。 然 后 就 有 一 个 问题 ， 为 什么 不 直接 用 Java 代码 开发 快速 路 
径 VM 服务 呢 ? 

用 Java 代码 编写 VM 服务 是 不 可 能 的 ， 因 为 VM 服务 存在 的 意义 仅仅 是 为 Java 提供 底层 文 
持 。 用 Java 编写 VM 服务 就 形成 了 循环 依赖 。 也 就 是 说 ，Java 应 用 程序 访问 VM 服务 以 获得 底 
层 资源 ， 而 用 Java 编写 的 VM 服务 又 需要 更 低 一 层 VM 服务 来 完成 这 个 目标 。 

男 一 方面 ， 用 Java 的 一 个 变 体 来 实现 这 个 目标 则 是 可 能 的 。Apache Harmony 使 用 一 个 “ 非 
安全 Java” 库 开发 一 些 快速 路 径 服务 。 这 个 库 提 供 了 几 个 特殊 的 Java 类 ， 编 译 器 把 它们 当 作 内 
在 服务 。 

例如 ， 库 中 的 Java 类 address 表示 一 个 内 存 地 址 ， 它 提供 了 一 个 接口 dereference () 用 
来 从 这 个 地 址 加 载 值 。JIT 编译 器 编译 调用 dereference () 的 字 节 码 时 ， 它 不 会 生成 一 个 真正 
的 方法 调用 ， 而 是 把 它 替 换 为 一 个 指针 解 引用 。 使 用 “ 非 安全 Java” 的 一 个 要 点 是 ， 它 会 和 普通 
Java 代码 一 起 ， 被 同一 套 (包括 JIT 在 内 的 ) VM 基础 设施 统一 处 理 ， 经 历 同 样 的 类 加 载 A 
编译 ， 等 等 。 缺 点 则 是 它 并 不 像 本 地 代码 那么 直观 ， 本 地 代码 不 需要 依赖 JIT 编译 器 来 生成 想 要 
的 代码 。 

VM 服务 的 内 联 和 优化 只 对 快速 路 径 可 行 ， 可 以 被 看 作 它 们 实现 的 Java 字 节 公 的 一 个 扩展 。 
VM 服务 的 慢 速 路 径 很 难 用 “ 非 安全 Java” KA, 仍然 需要 运行 时 辅助 。 我 们 已 经 看 到 ， 运 行 时 
辅助 大 量 使 用 汇编 代码 来 胶合 JIT 编译 的 代码 与 本 地 编译 器 编译 的 代码 。 当 VM 需要 精巧 的 代码 
序列 来 链接 Java 世界 与 本 地 世界 的 时 候 ， 情 况 都 是 如 此 ， 比 如 在 封装 代码 、 桥 接 代码 和 stub 代 
码 中 。 

为 多 个 不 同 的 微 架 构 编写 和 维护 汇编 代码 序列 是 繁复 的 工作 。 它们 可 以 用 其 他 语言 编写 , 将 
其 编译 为 期 望 的 代码 序列 ， 因 而 更 方便 。 例 如 ，Apache Harmony 使 用 一 个 名 为 LIL 的 “领域 专 
用 语言 ”编写 胶水 代码 。LIL 是 一 个 平台 无 关 的 低级 中 间 表 示 语 言 ， 可 以 表达 像 运行 时 栈 操作 和 
寄存 器 操作 这 样 的 底层 语义 。LIL 的 编译 器 (或 解析 器 ) 可 以 为 不 同 的 微 架构 生成 所 需 的 汇编 代 
码 。 注 意 LIL 的 使 用 不 是 为 了 提高 运行 效率 ， 而 是 为 了 提高 开发 效率 ,而 “ 非 安全 Java” 可 以 做 
到 一 箭 双 雕 。 


10.4 主要 VM 服务 


下 面 列 出 JVM 中 的 主要 VM 服务 。 它 们 都 需要 访问 VM 的 实现 细节 , 包括 JITA GC, 其 中 
多 数 可 能 触发 GC、 异 常 或 阻塞 操作 ， 因 此 需要 运行 时 辅助 。 如 果 一 个 VM 服务 可 能 调用 Java 代 
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E, 那么 所 有 这 些 ( 比如 GC、 异常 、 阻 寨 ) 因素 也 存在 。 在 下 面 的 列表 中 ， 我 们 特别 指出 了 那 
些 不 需要 运行 时 辅助 的 VM 服务 。 
(1) 编译 相关 
O 编译 一 个 方法 ， 以 方法 数据 结构 作为 输入 参数 。 这 个 方法 可 以 是 Java 或 者 本 地 方法 。 这 
个 服务 可 能 抛 出 异常 ， 执 行 Java 代码 (类 初始 化 、 异 常 构 造 ) ， 因 此 也 可 能 触发 GC. 
口 加 载 一 个 常量 String， 以 声明 的 类 以 及 字符 串 字 面值 在 常量 池 的 索引 值 为 参数 。 它 可 能 在 
生成 String 对 象 的 时 候 触 发 GC， 也 可 能 执行 Java 代码 以 对 字符 串 执行 驻 留 化 (interning )。 
这 个 服务 用 于 支持 字 节 人 码 ldc 实现 。 
(2) 异常 相关 

口 抛 出 一 个 异常 ， 参 数 为 异常 对 象 的 引用 ， 对 应 于 字 节 公 athrow。 这 个 函数 不 会 返回 ， 

因为 它 会 把 控制 传递 给 异常 处 理 器 或 者 最 近 的 本 地 调用 方法 。 

口 抛 出 一 个 链接 异常 ， 参 数 为 导致 链接 异常 的 条 目的 常量 池 索 引 、 声 明 类 和 异常 对 象 。 这 

个 异常 对 象 已 经 在 类 加 载 时 安装 。 

口 抛 出 一 个 访问 异常 ， 比 如 调用 抽象 方法 或 者 访问 私有 方法 时 引起 的 那些 异常 。 

(3) 线程 相关 

口 得 到 指向 线程 局 部 存储 的 指针 ， 无 参数 。 它 需要 访问 VM 实现 细节 。 不 需要 运行 时 辅 10 
助 。 

O monitorenter, 参数 为 monitor 对 象 。 可 能 阻塞 。 

口 monitorexit ， 参 数 为 monitor 对 象 。 如 果 线 程 解锁 并 非 由 它 持 有 的 monitor， 会 抛 出 异常 。 

(4) 类 支持 相关 

口 初始 化 类 ， 参 数 为 要 初始 化 的 类 。 它 执行 类 初始 化 函数 Java 代码 。 可 能 会 阻塞 等 待 另 一 
个 线程 初始 化 这 同一 个 类 。 它 应 该 在 运行 时 putstatic 和 getstatic 之 前 被 调用 ， 除 
非 已 知 这 个 类 已 经 完成 初始 化 。 

口 从 其 在 VM 中 的 对 应 物 〈 即 相应 的 VM Class 数据 结构 ) 找到 java.1lang.class WR, 
参数 为 指向 VM 的 Class 数据 结构 的 指针 。 每 个 类 都 有 一 个 由 VM 维护 的 数据 结构 ， 它 也 
是 一 个 java.lang.Class 的 实例 。 如 果 VM 不 把 它们 保存 在 一 起 ， 就 需要 这 个 VM 服 
务 来 从 一 个 找到 另 一 个 。 举 个 例子 ， 在 JIT 为 一 个 同步 静态 方法 的 monitor 指令 生成 参数 
的 时 候 会 使 用 这 个 服务 ， 其 中 参数 是 拥有 这 个 方法 的 类 的 java.1ang.class 实例 。 不 
需要 运行 时 辅助 。 

O 获取 对 象 的 接口 vtable， 参 数 为 这 个 对 象 和 一 个 接口 类 。 通 过 这 个 对 象 的 实际 类 对 这 个 
接口 实现 的 实际 方法 条 目 ， 它 加 载 这 个 接口 的 vtable。 如 果 无 法 找到 这 个 vtable 的 话 ， 它 
可 能 会 触发 异常 。 它 是 为 了 支持 字 节 码 invokeinterface 的 实现 。 


(5) 类 型 检查 相关 ， 这 是 前 面 类 支持 的 一 部 分 
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口 checkcast, 参数 为 对 象 和 这 个 对 象 要 转换 的 类 类 型 。 它 检查 这 个 对 象 是 否 为 给 定 类 型 。 
如 果 不 是 的 话 ， 会 抛 出 一 个 异常 。 它 是 为 了 实现 字 节 人 码 checkcast。 

口 instanceof。 与 checkast 相同 ， 只 不 过 它 不 会 抛 出 异常 ， 而 会 在 对 象 不 是 给 定 类 型 的 情况 
下 返回 0。 它 是 为 了 实现 字 节 码 instanceof。 

口 aastore， 参 数 为 数组 对 象 、 元 素 索 引 和 元 素 对 象 。 它 把 元 素 对 象 保存 在 数组 的 指定 索引 
位 置 上 。 如 果 这 个 对 象 不 是 数组 元 素 类 型 ， 它 可 能 触发 异常 。 它 是 为 了 实现 字 节 码 
aastore. 

(6) 垃圾 回收 相关 

口 分 配对 象 ， 参 数 为 对 象 大 小 和 它 的 类 。 如 果 堆 空间 紧张 的 话 ， 可 能 会 触发 GC。 内 存 不 
足 时 可 能 抛 出 异常 。 

口 分 配 一 维 数 组 (也 就 是 向 量 ) ， 参 数 为 数组 的 长 度 和 它 的 类 。 可 能 触发 GC 和 异常 。 

口 分 配 多 维 数组 ， 参 数 为 它 的 类 、 维 度 以 及 每 一 维 的 长 度 。 这 个 函数 使 用 变 长 参数 ， 所 以 
EMH caeci 调用 惯例 。 可 能 触发 GC 和 异常 。 

O 得 到 对 象 散 列 码 ， 参 数 为 这 个 对 象 。 这 个 隐 数 返回 这 个 对 象 关 联 的 标识 散 列 码 。 它 依赖 
于 VM 的 实现 细节 。 不 需要 运行 时 辅助 。 

口 GC 写 屏 障 ， 参 数 为 主 ( host ) 对 象 ， 主 对 象 中 的 字段 地 址 和 要 写 人 这 个 字段 的 客 ( guest ) 
对 象 引 用 。 它 还 包括 一 个 操作 类 型 参数 来 指明 这 是 哪 种 堆 写 操作 。 需 要 访问 GC 实现 细 
节 。 不 需要 运行 时 辅助 。 

O GC 读 屏 障 ， 参 数 为 对 象 和 它 要 读 的 字段 。 需 要 访问 GC 实现 细节 。 不 需要 运行 时 辅助 。 

OWA GC 安全 点 ， 无 参数 。 可 能 阻塞 。 

(7) JVMTI 相关 

口 JVMTI 回 调 。 它 们 是 一 组 用 于 JVMTI 事 件 的 VM 服务 : 方法 进入 、 方 法 退出 、 字 段 访 问 
和 字段 修改 。 每 个 都 是 当 对 应 事件 发 生 时 对 JVMTI 代 理 的 一 个 本 地 方法 的 调用 。 

(8) 惰性 解析 相关 

O 惰性 解析 。 它 们 是 用 于 惰性 解析 类 相关 操作 的 一 组 VM 服务: new 对 象 、new 数 组 、 初 始 
化 类 、 获 得 非 静 态 字 段 偏 移 、 获 得 静态 字段 地 址 、checkcast、instanceof， 以 及 得 到 
invokestatic、invokeinterface、invokevirtual Ml invokiespecial 的 入 口 点 
地 址 。 

另外 还 有 一 些 Java 代码 调用 的 辅助 函数 ， 但 我 们 将 其 看 作 编 译 胡 内 在 服务 ， 而 不 是 VM 服 

务 。 例 如 ，64 位 除法 运算 这 样 的 算数 运算 , 或 从 float 到 double 的 操作 数 类 型 转换 。 它 们 不 
一 定 要 被 归 类 为 VM 服务 ， 因 为 它们 不 依赖 于 具体 VM 实现 的 内 部 细节 ,所 以 不 同 的 JIT 可 以 有 
自己 的 实现 。 有 时 候 它 们 被 称 为 JIT 辅助 ， 类 比 于 运行 时 辅助 。 


Alls amid 





异常 抛 出 的 目的 是 把 控制 从 正常 流 中 转移 出 来 ， 以 处 理 异 常情 况 。 

Java 代码 和 本 地 代码 都 可 能 显 式 地 或 隐 式 地 抛 出 异常 。 显 式 异 常 搜 出 是 指使 用 Java 或 Java 
本 地 接口 (JNI) 中 的 “ 抛 出 ”应 用 程序 接口 (API ) 的 情况 ， 而 隐 式 异常 抛 出 是 指 应 用 程序 执行 
触发 了 某 个 条 件 (通常 是 哪里 出 错 了 )， 比 如 “内 存 不 足 ” 或 者 “未 找到 类 ”等 的 情况 。 对 隐 式 
情况 来 说 ， 是 虚拟 机 ( VM ) 为 应 用 程序 抛 出 异常 。 从 VM 的 角度 来 看 ， 显 式 与 隐 式 的 区 别 并 不 
重要 ， 因 为 隐 式 抛 出 对 VM 来 说 就 变 成 了 显 式 的 。 

异常 可 以 是 同步 的 或 异步 的 。 同 步 异 常 是 作为 线程 执行 某 条 指令 的 结果 被 触发 ，VM 在 需要 
的 时 候 就 地 抛 出 一 个 异常 ， 比 如 由 于 null 指针 解 引 用 导致 的 异常 。 所 有 显 式 抛 出 的 异常 都 是 同步 
异常 。 异 步 异 常 是 VM 当时 无 法 知道 的 ， 可 以 发 生 在 任意 时 间 点 上 ， 比 如 一 个 内 部 错误 。 

异常 只 在 单个 线程 内 部 抛 出 。 无 法 把 控制 流 从 一 个 线程 转移 到 另 一 个 线程 , 这 也 与 线程 的 定 
义 冲 突 。 一 个 线程 可 能 触发 某 些 条 件 ， 引 起 另 一 个 线程 抛 出 异常 ， 比 如 另 一 个 线程 发 出 线程 停止 
或 者 中 断 请 求 ， 这 也 是 一 个 异步 异常 。 这 种 情况 类 似 于 操作 系统 COS ) 的 信和 号 机 制 。 

一 般 来 说 ，VM 要 抛 出 一 个 异常 ， 需 要 执行 以 下 4 个 步骤 。 
O 步骤 1， 保存 异常 抛 出 上 下 文 ， 这 可 以 指明 异常 发 生 时 的 执行 状态 。 
口 步骤 2， 保存 栈 轨 了 迹 。 这 个 步骤 可 以 被 当 作 步骤 1 的 一 部 分 。 
O 步骤 3， 找到 异常 处 理 需 。 
口 步 又 4， 把 控制 传递 给 异 销 处 理 占 。 

在 某 些 语言 中 ， 还 有 一 个 步骤 $。 异 常 处 理 需 处 理 完 一 个 异常 之 后 ， 探 制 恢复 到 原来 异常 抛 
出 的 点 。 这 就 像 是 Linux 中 对 SIG_SEGV 的 默认 信号 处 理 方法 。 在 Java H, 没有 这 样 的 可 继续 异 


和 (continuable exception )。 


11.1 保存 异常 提出 上 下 文 


当 一 个 异常 被 抛 出 后 ，VM 所 做 的 第 一 件 事情 就 是 找到 执行 状态 。VM 可 以 通过 执行 状态 理 
解 这 个 异常 为 什么 抛 出 ， 在 哪里 被 抛 出 ， 以 及 是 什么 异常 。 然 后 VM 可 以 利用 这 些 信息 来 展开 
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一 个 栈 , 或 者 创建 一 个 可 以 输出 给 用 户 的 栈 轨 迹 。 为 此 ,执行 状态 中 的 主要 信息 就 是 寄存 带 文件 
内 容 。 


11.1.1 VM 保存 的 上 下 文 


对 于 显 式 异常 ，VM 能 够 在 它 抛 出 异常 时 就 地 保存 异常 状态 。 对 于 某 些 可 能 被 某 个 字 节 码 的 
执行 触发 的 同步 异常 ， 比 如 “被 零 除 ”“ 空 指针 解 引 用 ”和 “数组 越界 访问 ”>，VM 可 以 主动 检查 
当时 涉及 的 变量 ， 并 决定 是 否 应 该 抛 出 异常 ， 这 样 就 把 一 些 隐 式 异 常 转换 为 显 式 异常 ， 后 者 的 
执行 上 下 文 很 容易 获得 例如， 对 于 monitorenter ， 编 译 需 生成 下 面 的 伪 代 码 (实际 代码 是 机 
airy ): 


// obj 是 要 enter 的 monitor 


if( obj == NULL ){ 
Object* exc = runtime_new_object (NullPointerException) ; 
runtime_throw_exception (exc) ; 

}else{ 


runtime_monitor_enter (obj); 
} 
K% runtime_throw_exception() 是 一 个 运行 时 辅助 ， 它 调用 VM 服务 vm_throw_ 
exception()。 正 如 第 10 章 介 绍 过 的 ，runtime_throw_exception() 在 准备 Java 到 本 地 转 
换 的 时 候 需 要 保存 上 下 文 。 


void __stdcall runtime_throw_exception(Object* exc) { 
__asm{ 
push_M2N_wrapper 
// 重新 压 栈 参 数 
push [esp+size_M2N_wrapper ] 
call vm_throw_exception 
// 应 该 永远 不 会 运行 到 此 处 


} 


11.1.2 Linux 中 OS 保存 的 上 下 文 


有 些 同步 异常 可 以 被 硬件 检测 到 ， 比 如 X86 架构 上 的 “被 去 除 ” 和 “ 空 指针 解 引 用 ”。VME 
不 需要 为 每 个 整数 除法 和 解 引 用 操作 检查 变量 值 , 这 比 人 硬件 检测 要 慢 得 多 。 如 果 发 生 错 误 , 处 理 
器 会 抛 出 一 个 硬件 异常 ， 由 OS 内 核 来 处 理 。 然 后 OS 内 核 保 存 CPU 执行 状态 ， 并 发 送 一 个 OS 
事件 , 这 个 状态 就 放 在 事件 上 下 文中 。 例如 , 对 于 空 指针 访问 , Linux 中 的 OS 事件 是 STG_SEGV, 
而 在 Windows 中 是 异常 EXCEPTION_ACCESS_VIOLATION。 

首先 ，VM 需要 一 个 数据 结构 作为 执行 状态 的 临时 存储 。 

// 保存 执行 上 下 文 的 数据 结构 


struct Registers { 
U_32 eax; 
U32 .ebx; 
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U_32 ecx; 
U_32 edx; 
U_32 edi; 
U_32 esi; 
U_32 ebp; 
U_32 esp; 
U_32 eip; 
U_32 eflags; 





} 


在 Linux 中 ，VM 需要 为 SIG_SEGYV 注册 一 个 信和 号 处 理 函 数 。 然 后 它 可 以 在 这 个 信号 处 理 函 
数 中 使 用 如 下 代码 获得 执行 上 下 文 。 这 个 信号 处 理 函 数 从 OS 内 核准 备 的 事件 上 下 文 数据 结构 中 
加 载 执行 上 下 文 信息 。 


// 初始 化 信号 
int initialize_event_handlers () 


{ 


struct sigaction sa; 

sigemptyset (&sa.sa_mask); 

sa.sa_flags = SA_SIGINFO | SA_ONSTACK; 
sa.sa_sigaction = null_ref_handler; 
sigaction(SIG_SEGV, &sa, NULL); 





// 其 他 处 理 
} 


// SIG_SEGV 的 信号 处 理 函数 

void null_ref_handler(int signo, siginfo_t* info, void* context) { 
VM_Thread* self = current_thread() ; 
Registers* regs = self->context_regs; 





// EF XW OS 内 核 为 这 个 事件 准备 

ugontext_t* uc = (UGCONtext t*)eontext; 
regs->eax = uc->uc_mcontext.gregs [REG EAX]; 
regs->ecx = uc->uc_mcontext.gregs [REG_ECX]; 
regs->edx = uc->uc_mcontext.gregs [REG_EDX]; 
regs->edi = uc->uc_mcontext.gregs [REG_EDI]; 
regs->esi = uc->uc_mcontext .gregs [REG_ESI]; 
regs->ebx = uc->uc_mcontext.gregs [REG_EBX] ; 
regs->ebp = uc->uc_mcontext.gregs [REG_EBP] ; 
regs->eip = uc->uc_mcontext.gregs[REG_EIP]; 
regs->esp = uc->uc_mcontext.gregs [REG_ESP] ; 
regs->eflags = uc->uc_mcontext.gregs [REG_EFL] ; 








// 其 他 处 理 


11.1.3 Windows 中 OS 保存 的 上 下 文 


在 Windows 中 与 在 Linux 中 非常 类 似 , 除了 使 用 向 量 异常 处 理 ( vectored exception handling, 
VEH ) 机 制 。 
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// 初始 化 VEH 
int initialize_event_handlers () 
{ 
Fipa 
AddVectoredExceptionHandler(0, null_ref_handler) ; 


// 其 他 处 理 
} 


// 异常 处 理 函 数 
LONG CALLBACK null_ref_handler (LPEXCEPTION_POINTERS winexc) 
{ 

VM_Thread* self = current_thread(); 

Registers* regs = self->context_regs; 


PCONTEXT context = winexc->ContextRecord; 
regs->eax context->Eax; 
context->Ecx; 
context->Edx; 
context->Edi; 
context->Esi; 
context->Ebx; 


regs->ecx 
regs->edx 
regs->edi 
regs->esi 
regs->ebx 
regs->ebp context->Ebp; 
regs->eip context->Eip; 
regs->esp context->Esp; 
regs->eflags = context->EFlags; 


|' ee ee He oh 





// 其 他 处 理 


} 


1.1.4 同步 与 异步 异常 


VM 不 一 定 知道 异常 何 时 抛 出 。 对 于 像 “ 线 程 停 止 ”这 样 的 异步 异常 来 说 ， 当 前 线程 接收 到 
请 求 之 后 ， 应 该 一 有 机 会 就 抛 出 一 个 异常 。 关 于 异步 异常 需要 何 时 被 处 理 ， 并 没有 严格 的 时 间 
要 求 。 

WERK 


当前 线程 可 以 在 每 个 垃圾 回收 ( GC ) 安全 点 检查 是 否 有 未 处 理 的 “线程 停止 ”请 求 。 如 果 
有 的 话 , 这 个 线程 在 离开 安全 点 之 前 会 抛 出 一 个 异常 ,那么 执行 上 下 文 反映 了 这 个 安全 点 的 状态 。 
与 funtime_throw_exception() 类 似 ， 它 也 是 通过 一 个 保存 执行 上 下 文 的 运行 时 辅助 来 调用 
ae ho 


正如 6.10 节 中 所 提 到 的 , 可 以 利用 OS 对 事件 处 理 的 专门 支持 来 实现 安全 点 , 也 可 以 用 类 似 
技术 实现 某 种 异步 异常 触发 机 制 。 一 个 线程 可 以 向 男 一 个 线程 发 送 一 个 事件 , 接收 事件 的 线程 已 
经 注册 了 一 个 事件 处 理 函 数 来 处 理 这 个 事件 。 于 是 执行 状态 就 保留 在 由 OS 内 核 保存 的 事件 上 下 
文中 。 
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总 结 一 下 , 异常 可 能 是 由 VM 用 运行 时 辅助 主动 抛 出 , 也 可 能 是 因 硬 件 异 常 而 在 事件 处 理 范 
数 中 被 动 抛 出 。 在 前 一 种 情况 中 , 异常 对 象 通常 是 在 调用 运行 时 服务 之 前 创建 的 。 在 后 一 种 情况 
中 ,异常 对 象 在 被 抛 出 之 前 ， 需 要 先 在 事件 处 理 函 数 中 创建 。 这 两 种 情况 下 ， 异 常 都 发 生 在 编译 
后 Java 代码 中 。 

为 了 区 分 主动 抛 出 和 被 动 搜 出 的 异常 ，VM 可 以 使 用 一 个 标志 。 举 例 来 说 ， 如 果 异 和 常 是 被 
主动 抛 出 的 ， 可 以 把 上 下 文 寄存 器 设置 为 空 或 某 个 特定 值 ， 因 为 可 以 从 Java 艇 指针 中 构建 帧 上 
开交。 

2. GC 安全 性 

如 果 VM 主动 抛 出 一 个 异常 ， 默 认 情 况 下 对 运行 时 辅助 的 调用 点 是 一 个 GC 安全 点 , 但 是 把 
需要 操纵 栈 的 异常 抛 出 过 程 放 到 安全 区 域 中 并 不 是 一 个 好 主意 。 如 果 在 安全 区 域 发 生 了 GC 的 话 ， 
GC 在 处 理 栈 的 时 候 可 能 会 与 异常 抛 出 时 对 栈 的 处 理发 生 冲 突 。 而 且 如 果 关 闭 了 GC 的 话 ， 也 更 
容易 直接 访问 异常 对 象 。 不 过 在 这 个 过 程 中 , 可 以 在 合适 的 时 候 有 一 些 短 时 间 的 安全 区 域 ， 以 方 
便 GC 的 发 生 。 

如 果 异 常 是 在 一 个 事件 处 理 阴 数 内 抛 出 的 话 ， 导 致 这 个 人 硬件 异常 的 指令 应 该 是 一 个 市 有 
GC-map 信息 的 GC 安全 点 。 异 常 对 象 的 创建 可 能 触发 回收 ， 而 且 和 普通 Java 代码 一 样 需 要 执行 
XT RA A o 

我 们 还 没有 讨论 异常 在 本 地 代码 内 被 抛 出 的 情况 ， 这 是 下 一 节 的 主题 。 


11.2 ”本 地 代码 内 与 跨 本 地 代码 异常 处 理 


JVM 在 Java 代码 和 本 地 代码 中 以 不 同方 式 处 理 异常 。 在 Java 世界 中 ,一 旦 有 异常 抛 出 ， 控 
制 流 就 立即 转移 到 异常 处 理 器 ， 或 者 如 果 找 不 到 处 理 需 ， 线 程 就 会 终止 。 然 而 在 本 地 世界 中 ， 
VM 代码 对 本 地 语言 的 异常 支持 不 做 任何 假设 ， 这 和 JNI 支 持 的 哲学 是 一 致 的 。 不 过 ，VM 提供 用 
于 异常 操作 的 JI 函数 (JNIAPI), 比如 Throw()、ExceptionOccurred() 和 ExceptionClear ()。 


11.2.1 本 地 代码 内 的 异常 处 理 


当 本 地 代码 中 抛 出 异常 的 时 候 , 控制 流 不 会 立即 转移 到 异常 处 理 器 , 因为 本 地 语言 可 能 根本 
就 没有 “异常 处 理 右 ”这 个 概念 。VM 只 把 这 个 异常 内 部 保存 在 线程 局 部 存储 中 。 人 然后 本 地 代码 
可 以 使 用 INI APL 来 检查 是 否 发 生 了 任何 异常 ( 即 通 过 检查 指示 异常 发 生 的 线程 局 部 存储 )， 然 
后 决定 是 否 要 处 理 它 。 这 些 API 支持 本 地 代码 对 异常 执行 各 种 操作 ， 比 如 清理 已 存在 的 异常 、 保 
持 异 常 不 变 , 或 者 抛 出 一 个 新 异常 ( 即 在 线程 局 部 存储 中 保存 一 个 新 异常 )。 

VM 唯一 需要 为 本 地 代码 异常 处 理 所 做 的 事情 就 是 实现 几 个 处 理 异 常 的 JNI Pa, AN, 
面 的 代码 实现 了 JNIAPI Throw() ， 它 抛 出 一 个 异常 jobj。 
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jint JNICALL Throw(JNIEnv* jni_env, jthrowable jobj) 
£ 


ifi typeby ) return 二 二 


VM_Thread* self = current_thread(); 
// jobj 是 一 个 对 象 铅 柄 指针 
vm_leave_saferegion(); 
self->exception_obj 


= jobj->obj; 
vm_enter_saferegion(); 


return 0; 


} 

尽管 这 个 API 命名 为 Throw() ， 但 它 的 实现 并 不 真正 “ 抛 出 ”这 个 异常 或 者 转移 控制 ， 而 
是 把 异常 对 象 保存 在 线程 局 部 存储 。 本 地 方法 的 执行 会 继续 进行 ,而 不 是 突然 结束 。 当 本 地 方法 
返回 到 它 的 Java 调用 方 之 后 ， 实 际 “ 抛 出 ”过 程 在 Java 帧 中 继续 。 注 意 在 回收 过 程 中 应 该 枚 举 
保存 在 线程 局 部 存储 (TLS ) 的 异常 对 象 。 


当 本 地 代码 返回 到 Java 世界 的 时 候 ， 线 程 局 部 存储 中 的 未 处 理 异 常 将 作为 从 当前 Java 帧 中 
抛 出 的 异常 ， 继 续 在 Java 世界 中 被 处 理 。 通 过 这 种 方式 ， 本 地 代码 具有 几乎 完整 的 Java 异常 处 
理 能 力 ， 包 括 把 异常 传递 到 它 的 Java 异常 处 理 器 ， 以 及 编写 “本 地 异常 处 理 咒 "。 这 个 名 称 打上 
引号 是 因为 它 和 Java 异常 处 理 需 并 不 相同 。 


在 Java 代码 中 ， 当 一 个 catch 块 对 应 的 try 块 抛 出 一 个 匹配 异常 时 ，VM 会 自动 调用 它 。 
而 在 JNI 本 地 代码 中 , 异常 处 理 可 能 就 像 下 面 这样 , 这 对 于 VM 来 说 是 不 可 见 的 ,因为 本 地 代码 
并 不 由 VM 编译 。 

jthrowable exception = ExceptionOccurred(jenv) ; 

if( exception ) { 

// 异常 处 理 器 


} 
Re ate 


JNI API Exceptionoccurred() 检 查 线程 局 部 存储 中 是 否 保 存 了 任何 异常 对 象 。 在 “本 地 
异常 处 理 器 ”中 ,本 地 方法 可 以 调用 INI Exceptionclear () 来 清理 线程 局 部 存储 中 的 异常 对 象 ， 
以 此 完成 它 的 抛 出 过 程 。 


11.2.2 HAR Java 代码 返回 到 本 地 代码 


当 Java 代码 中 抛 出 异常 后 , VM 会 展开 栈 来 找到 异常 处 理 顺 。 由 于 在 本 地 代码 中 没有 VM 可 
见 的 异常 处 理 器 ， 栈 展开 过 程 不 能 在 本 地 帧 处 简单 地 继续 前 进 。VM 不 知道 本 地 方法 中 是 否 有 任 
何 异常 处 理 。 尽 管 VM 可 以 跳 过 本 地 帧 ， 通 过 Java 簇 指针 继续 展开 栈 ， 但 这 不 是 处 理 异 常 的 正 
确 方法 ， 因 为 跳 过 本 地 帧 可 能 也 就 跳 过 了 本 地 方法 中 的 “本 地 异常 处 理 带 ”。 

正确 的 处 理 方法 是 ， 栈 展开 过 程 应 该 在 本 地 帧 处 停止 ， 并 恢复 执行 本 地 代码 ， 就 像 是 Java 
被 调用 方 返回 到 了 这 个 本 地 方法 一 样 , 尽管 是 突然 返回 。 然后 这 个 本 地 代码 的 责任 是 走 一 遍 自 己 
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的 异常 处 理 逻 辑 。 
我 们 已 经 讨论 过 本 地 代码 到 Java 代码 的 转换 。 本 地 代码 通过 调用 一 个 JNIAPI 来 调用 方法 ， 
比如 callvoidMethod()， 它 又 会 调用 vm_execute_java_method() 来 完成 这 次 本 地 到 Java 


转换 ， 如 下 所 示 。 


void vm_execute_java_method( jmethodID* mid, 
jvalue* pargs, 
jvalue* ret) 


// 线程 在 调用 这 个 函数 之 前 离开 安全 区 域 


assert ( !thread_in_saferegion() ) 


Method* method = (Method*)mid; 

// 参数 字数 (不 是 参数 个 数 ， 

// BA long/double 有 两 个 字 ) 

char* desc; // 方法 描述 符 

java_ type ret_type; // 返回 类 型 
method_get_param_info(method, &desc, &ret_type); 


// 处 理 输入 值 

uint32 nargs = 0; 

for(++desc; (*desc) != ')"'; desc++) { 
java_type type = (java_type) *desc; 


switch( type ){ 
case JAVA_TYPE_CLASS: 
case JAVA_TYPE_ARRAY: 





// 就 地 解 封 引用 参数 ， 
// 把 对 象 句柄 赫 换 为 对 象 引用 
Object_handle* hndl; 


bndl = (Object_handle*)pargs[nargs]; 
pargs[nargs] = (jvalue) (hndl ? hndl->obj : NULL); 
while(type == ‘[’) desc++; 
ify type == “Le J 
while( type != ';’ ) desc++; 
nargs++; 
break; 


case JAVA_TYPE_LONG: 
case JAVA_TYPE_DOUBLE: 
nargs+ = 2; 
break; 


default: 
nargs++; 
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// 得 到 Java FRAT 
void* java_entry = method_get_entry (method); 


uint32 eax, edx; // 返回 值 
native_to_java_call(java_entry, nargs, pargs, &eax, &edx); 


// 检查 是 否 有 待 处 理 异常 ， 清 除 返 回 值 
if( thread get pending exception() ){ 
*ret = (jvalue)0; 


return; 
// 处 理 返 回 值 
if ( ret_type == JAVA_TYPE_VOID) return; 
((uint32*)ret) [0] = eax; 
// 第 二 个 字 只 对 long/double 类 型 有 用 
((uint32*)ret) [1] = edx; 


// 如 果 返 回 值 是 引用 ， 封 箱 它 


if( ret_type == JAVA_TYPE_CLASS || 
ret_type == JAVA_TYPE_ARRAY ) 
{ 
if( eax != NULL ){ 
Object_handle* hndl = allocate_local_obj_handle(); 
hndl->obj = (Object*) eax; 
*ret = (jvalue)hndl; 
} 
} 
return; 


void native_to_java_call(void *java_entry, 
uint32 n_arg_words, uint32 *p_args_words, 
uint32 *p_eax_var, uint32 *p_edx_var) 


_ asm { 
// 压 栈 所 有 参数 
mov n_arg_words -> ecx 
mov p_arg_words -> eax 


loop_more_args: 


or ecx, ecx // 剩 下 的 参数 字数 

jz finished_args // 没有 了 就 跳出 
push dword ptr [eax] // 压 栈 一 个 字 

dec ecx // 递减 剩余 字数 

add 4 -> eax // 移动 到 下 一 个 参数 字 
jmp loop_more_args // 循环 回去 继续 


finished_args: 
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// 所 有 的 参数 都 在 栈 上 ， 准 备 好 调用 
call dword ptr [meth_addr] 


// 如 果 有 一 个 返回 值 


mov p_eax_var -> ecx 
mov eax -> [ecx] // 存储 eax 到 eax_var 
mov p_edx_var -> ecx 

mov edx -> [ecx] // ik edx 到 edx_var 


} 
} 


如 果 异 常 在 被 调用 的 Java 方 法 中 没有 匹配 的 异常 处 理 器 ， 并 且 蜡 常 抛 出 过 程 到 达 本 地 代码 ， 
那么 这 个 Java 方 法 就 会 突然 结束 ， 然 后 控制 流 返回 到 Java 方法 调用 的 下 一 条 指令 。 
call dword ptr [meth_addr] 
当 执 行 完 成 对 native_to_java_call () 的 调用 后 , VM 会 检查 异常 抛 出 过 程 是 否 设置 了 任 
何 未 处 理 异 常 。 如 果 有 的 话 ，VM 会 清除 返回 值 。 


Pirri 
uint32 eax, edx; // 返回 值 
native_to_java_call(java_entry, nargs, pargs, &eax, &edx); 


// 检查 是 否 有 未 处 理 异常 ， 清 除 返 回 值 

if( thread get pending exception() ) { 
*ret = (jvalue)0; 
return; 


} 

上 面 的 VM 代码 返回 到 “调用 方法 ”的 JNIAPI， 比 如 callvoidMethod() ， 它 会 接着 返回 
到 通过 INI API 调用 Java 方 法 的 本 地 方法 。 然 后 这 个 本 地 方法 可 以 继续 异常 处 理 过 程 。 

当 本 地 代码 返回 到 Java 代码 时 ， 如 果 有 任何 未 处 理 的 异常 ，VM 会 重新 开始 Java 帧 栈 展开 
过 程 ， 就 像 之 前 介绍 的 一 样 。 

如 果 出 现下 面 3 种 情况 之 一 ， 那 么 异常 抛 出 过 程 完成 。 

(1) 在 Java 方 法 中 找到 异常 处 理 回 ， 控 制 以 异常 作为 参数 转移 到 这 个 异常 处 理 器 。 如 果 这 个 

异常 处 理 器 再 次 抛 出 这 个 异常 ， 或 者 抛 出 一 个 新 异常 ， 就 会 启动 新 一 轮 异 常 抛 出 过 程 。 

(2) 本 地 方法 清除 了 这 个 异常 。 如 果 本 地 方法 重新 抛 出 这 个 异常 或 抛 出 一 个 新 异常 ， 就 会 开 

始 新 一 轮 异 常 抛 出 。 

(3) 异常 没有 被 任何 方法 处 理 ， 线 程 终止 。 

总 结 一 下 ， 异 常 的 栈 展开 过 程 实际 上 是 一 个 Java 帧 展开 和 本 地 代码 执行 的 混合 过 程 。 这 样 
设计 的 一 个 关键 原因 是 ，VM 没有 优雅 且 可 移植 的 方法 ， 可 以 在 本 地 代码 中 找到 匹配 的 异常 处 理 
器 。 它 必须 把 这 个 工作 委托 给 本 地 代码 本 身 。 图 11-1 展示 了 栈 展 开 过 程 。 本 地 帧 中 的 虚线 表示 
它 本 身 不 是 一 个 栈 展开 ， 而 是 作为 过 程 的 一 部 分 ， 假 定 过 程 中 间 没 有 异常 处 理 。 
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图 11-1 带 本 地 帧 的 异常 处 理 


基于 这 个 设计 , 要 在 VM 中 为 本 地 代码 实现 异常 抛 出 相对 来 说 比较 简单 ,因为 它 实际 上 所 做 
的 只 不 过 是 让 本 地 代码 像 平 常 那样 执行 。 


11.2.3” 带 异常 的 本 地 代码 返回 到 Java 代码 


当 一 个 本 地 方法 返回 到 Java 世界 中 时 ， 它 实际 上 返回 到 Java 到 本 地 封装 。 封 装 代码 检查 线 
程 局 部 存储 (TLS) 中 是 否 还 有 任何 待 处 理 异 常 。 如 果 有 的 话 ， 封 装 代码 就 调用 VM 服务 来 抛 出 
它 ， 就 像 是 从 Java 帧 抛 出 的 一 样 。 以 下 代码 展示 了 这 个 概念 。 

// 操作 展示 在 下 面 的 注释 中 


__asm{ 


// push_M2N_wrapper 

// 如 果 有 引用 参数 ， 创 建 局 部 对 象 句柄 
// 压 栈 本 地 方法 参数 

// 用 于 同步 方法 的 monitorenter 
// 为 本 地 方法 打开 GC 

// 调用 实际 本 地 方法 

// 保存 返回 值 

// 为 本 地 方法 关闭 GC 

// 用 于 同步 方法 的 monitorexit 
// 如 果 是 返回 值 是 引用 类 型 ， 解 封 它 
// 释放 局 部 对 象 铅 栖 
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// 检查 TLS 中 是 否 有 保存 的 异常 对 象 


call thread get pending exception 


// 检查 返回 值 是 否 


Or eax,eax 


RERE (异常 ) 


// RA, Fea SRE 
je EXCEPTION DONE 
// 调用 VM 服务 来 继续 异常 抛 出 


call thread rethrow pending exception 


// 控制 流 永远 不 应 


该 到 达 这 里 


int 3 // <- 一 个 断 点 ， 只 是 为 了 调试 目的 


EXCEPTION _ DONE: 


// 恢复 返回 值 


// pop_M2N_wrapper 
// 返回 并 弹出 Java 参数 


} 
FAG eR SE UT F : 


void thread_set_pending_exception(Object* exc) 


{ 


VM_Thread* self = current_thread(); 
self->exception_obj = exc; 


} 


Object * thread_get_pending_exception() 


{ 


VM_Thread* self = current_thread(); 
Object* exc = self->exception_obj; 


return exc; 


} 


void thread_rethrow_pending_exception() 


{ 


Object* exc = thread_get_pending_exception() ; 
thread_clear_pending_exception() ; 
vm_throw_exception( exc ); 

// 永远 不 会 到 达 这 里 


} 


当 执行 返回 到 Java 到 本 地 封装 时 , 代码 回 到 了 Java 世界 , 在 这 里 重新 抛 出 异常 会 转移 控制 ， 


因此 封装 代码 永远 不 会 返 
样 。 材 状态 类 似 于 用 运行 


回 。 这 种 情况 下 ,异常 重 抛 出 也 是 主动 的 ， 和 其 他 非 硬 件 异常 的 情况 一 
时 辅助 抛 出 异常 的 情况 ， 但 是 当前 栈 是 由 Java 到 本 地 封装 准备 的 。 这 


FE, VM 不 需要 区 分 主动 异常 抛 出 是 来 自 于 本 地 代码 还 是 来 自 于 Java 代码 。 异 常 对 象 中 保存 的 栈 


轨迹 会 表明 这 个 异常 来 日 


11.3 ”保存 栈 轨 迹 


于 哪里 ， 这 是 下 一 节 的 主题 。 


VM 一旦 得 到 了 异常 抛 出 上 下 文 ， 就 可 以 找到 栈 轨 迹 并 把 它 保存 在 异常 对 象 中 。 此 刻 应 该 在 


控制 转移 到 异常 处 理 需 之 


前 就 保存 栈 轨迹 ， 因 为 之 后 栈 轨迹 信息 可 能 会 被 丢失 。 
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栈 轨 迹 通常 是 通过 从 异常 对 象 创建 点 展开 栈 获得 的 。 有 时候 需要 得 到 异常 抛 出 点 的 栈 轨 迹 。 
异常 对 象 创建 点 和 异常 抛 出 点 的 位 置 可 能 是 不 同 的。 可 以 创建 一 个 异常 对 象 并 把 它 传递 给 其 他 线 
程 扫 出 。( 甚至 也 没有 什么 能 阻止 你 把 异常 传递 到 其 他 线程 , 尽管 这 通常 是 一 个 坏 实践 。) 这 两 种 
情况 意味 着 不 同 的 问题 。 如 果 人 允许 在 异常 抛 出 时 获得 栈 轨迹 ， 那 么 就 有 机 会 惰性 创建 异常 对 象 。 
在 JVM 中 ， 栈 轨迹 是 强制 性 保存 在 异常 对 象 中 的 ， 在 异常 对 象 构造 器 中 生成 。 


很 多 情况 下 , 异常 处 理 需 并 不 真正 需要 异常 对 象 本 身 ,， 而 是 利用 异常 抛 出 机 制 来 实现 控制 流 
操纵 或 捕获 例外 的 运行 条 件 。 在 这 些 情 况 中 , 异常 对 象 只 用 于 帮助 找到 匹配 的 异常 处 理 器 。 一 旦 
找到 异常 处 理 融 ,异常 对 象 实际 上 就 死 掉 了 。 为 了 匹配 异常 处 理 融 ， VM 需要 的 实际 上 是 异常 对 
象 的 类 ， 而 不 是 这 个 对 象 本 身 。 基 于 这 个 观察 结果 ， 某 些 情况 下 有 可 能 省 略 异常 对 象 创建 ， 因 此 
也 就 没有 关联 的 栈 轨迹 创建 。 这 大 大 节省 了 运行 时 操作 , 更 不 要 提 这 些 对 象 创建 可 能 引发 的 垃 专 
回收 了 

一 个 解决 方案 是 惰性 创建 异常 对 象 。 也 就 是 说 ， 默 认 情况 下 ，VM 只 在 下 列 情况 之 一 发 生 的 
前 提 下 才 创 建 异常 对 象 。 

CO 情况 1: 异常 对 象 构造 器 的 执行 会 可 能 会 有 副作用 ， 比 如 写 人 异常 对 象 以 外 的 其 他 对 

象 ， 抛 出 异常 ， 或 者 进入 monitor, 

O 情况 2: 目标 异常 处 理 需 会 访问 异常 对 象 。 

O 情况 3: 栈 展开 过 程 在 到 达 匹 配 的 异常 处 理 融 之 前 会 遇 到 本 地 方法 帧 。 

在 上 面 的 情况 1 中 , 必须 像 平常 那样 创建 异常 对 象 。 也 就 是 说 , 在 异常 抛 出 时 就 要 及 早 创建 。 
在 另外 两 种 情况 下 ，VM 可 以 及 早 或 惰性 创建 异常 对 象 。 惰 性 创建 意味 着 VM 可 以 把 创建 推迟 ， 
直到 它 找 到 匹配 的 异常 处 理 融 或 者 栈 展开 过 到 本 地 帧 时 。 否则 ,可 以 忽略 异常 对 象 。 需要 考虑 情 
况 3 是 因为 ，VM 不 知道 本 地 方法 会 如 何 处 置 异常 对 象 。 

为 了 生成 栈 轨 迹 , 从 保存 在 异常 对 象 中 的 执行 上 下 文 开 始 执 行 栈 展 开 过 程 。 它 可 以 从 运行 时 
辅助 建立 的 本 地 帧 开始 ， 也 可 以 从 引发 硬件 异常 的 Java 帧 开始 。 可 以 通过 栈 基 指针 ( 对 于 Java 
W) 或 者 Java 艇 指针 (〈 对 于 本 地 帧 ) 识别 一 个 帧 。 我 们 使 用 指令 指针 作为 一 个 标志 来 指示 抛 出 
上 下 文 的 帧 类 型 。 

Frame_context* start_frame(VM_Thread* thread) 

{ 


Registers* regs = thread->context_regs; 
Frame_context* frame = vm_alloc(sizeof (Frame_context) ); 





frame->jcp = thread->jcp; 
frame->eip = regs->eip; 
// 这 里 eip 值 复 用 作为 一 个 标志 
if( regs->eip != OxFFFFFF ) 
frame->ebp = regs->ebp; // Java 代码 中 的 硬件 异常 


return frame; 
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Stack_frame* vm_get_thread_stacktrace(VM_Thread* thread) 
{ 
Frame_context* frame = start_frame (thread); 
Stack_frame* trace = stacktrace_create(); 


while(frame) { 
Stack_frame* method; 
Code_Type type = code_type(frame) ; 
if( type == CODE_TYPE_JAVA) { 
method = get_java_stackframe (frame); 


jelse{ // 本 地 代码 
method = get_native_stackframe (frame) 
} 


stacktrace_add_frame(trace, method) ; 
frame = preceding_frame(frame) ; 
} 


return trace; 
} 


在 上 面 的 示例 代码 中 ， 使 用 指令 指针 (eip) 来 指示 顶层 帧 类 型 : Java 帧 或 者 本 地 帧 。 这 是 
因为 ， 如 果 蜡 常 由 硬件 错误 导致 ， 那 么 硬件 保存 的 指令 指针 值 会 指向 Java 代码 中 的 出 错 指令 。 
如 果 异 常 不 是 由 硬件 错误 引发 , 而 是 由 VM 用 运行 时 辅助 主动 抛 出 , 那么 抛 出 点 的 指令 指针 值 没 
有 用 处 , 会 指向 某 个 本 地 代码 。 这 也 是 为 什么 可 以 把 保存 的 异常 上 下 文中 的 指令 指针 条 目 用 作 一 
个 标志 的 原因 。 

实际 上 , 根据 实现 的 偏好 不 同 , 根据 异常 上 下 文 所 确定 的 起 始 帧 不 一 定 是 异常 抛 出 时 的 第 一 
个 帧 ， 因 为 顶层 的 几 帧 可 能 是 由 异常 抛 出 过 程 引 入 的 ， 当 异常 发 生 的 时 候 ， 它 们 并 不 在 栈 上 。 因 
此 这 几 帧 可 以 跳 过 。 如 果 异 常 由 编译 的 Java 代码 中 的 硬件 错误 引发 ， 那 么 展开 过 程 从 导致 硬件 
错误 的 方法 开始 ， 而 这 正 是 保存 的 异常 上 下 文 标识 的 起 始 帧 ， 因 此 不 需要 跳 过 它 。 


为 了 使 输出 更 优雅 ，VM 还 可 能 会 忽略 中 间 某 些 用 于 调用 其 他 方法 的 反射 (reflection ) 帧 。 
在 某 种 程度 上 ， 这 些 反射 方法 调用 就 像 是 本 地 到 Java 桥接 代码 或 者 Java 到 本 地 封装 代码 ， 如 果 
用 户 只 关心 方法 调用 链 的 话 ， 就 不 一 定 关心 这 些 反 射 方 法 调用 。 


11.4 ”找到 异常 处 理 器 


根据 JVM 规范 ， 每 个 Java 方 法 都 安装 有 零 个 或 多 个 异常 处 理 器 。 每 个 异常 处 理 顺 指定 了 这 
个 处 理 函 数 关 联 的 方法 中 的 代码 范围 ,以 及 这 个 异常 处 理 器 捕获 的 异常 类 型 。 当 这 个 方法 中 抛 出 
一 个 异常 时 ,如果 异 常 抛 出 点 在 一 个 异常 处 理 器 的 范围 之 内 , 并 且 蜡 常 类 型 可 赋 给 这 个 异常 处 理 
融 的 捕获 类 型 ， 那 么 这 个 异常 就 匹配 于 这 个 处 理 咒 ， 控 制 流 应 该 转移 到 这 个 处 理 器 。 

如 果 当 前 方法 没有 匹配 的 异常 处 理 器 ， 当 前 方法 就 会 立即 结束 , 它 的 帧 从 栈 上 弹出 。 这 使 得 
栈 进 入 如 同 这 个 方法 刚 被 调用 之 前 (或 之 后 ) 的 状态 。 然 后 异常 在 调用 方 的 上 下 文中 重新 抛 出 ， 
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就 像 它 是 由 调用 指令 触发 的 一 样 。 
如 果 调 用 方 是 一 个 Java 方 法 , 就 重复 前 面 描述 的 过 程 。VM 继续 在 调用 方法 中 调用 指令 处 为 
异 篆 寻找 一 个 匹配 的 异 稼 处 理 器 。 如 果 调 用 方 是 本 地 方法 ，VM 把 控制 转移 到 这 个 本 地 方法 ， 就 
像 是 Java 被 调用 方刚 返回 到 本 地 调用 方 ， 而 且 返 回 值 被 清除 的 情况 一 样 。 
在 抛 出 过 程 立即 结束 一 个 方法 之 前 ， 线 程 应 该 退出 它 在 这 个 方法 中 进入 的 所 有 monitor. 
O 如 果 线 程 进入 一 个 monitor 是 由 于 一 个 同步 块 ， 并 且 从 这 个 块 中 抛 出 了 一 个 异常 的 话 ， 那 
么 默认 情况 下 ， 这 个 方法 内 必须 有 一 个 异常 处 理 器 来 捕获 这 个 异常 。 这 个 默认 处 理 器 会 
退出 它 持 有 的 monitor， 然 后 重新 抛 出 这 个 异常 。 
O 如 果 线 程 进入 一 个 monitor 是 因为 这 个 方法 是 同步 的 ， 那么 没有 专门 用 来 退出 monitor 的 
异常 处 理 咒 。 在 立即 需要 结束 这 个 线程 (因为 没有 匹配 异常 处 理 器 ) 时 退出 monitor 是 
VM 的 责任 。 


VM 通过 这 种 方式 递归 地 沿 着 方法 调用 链 向 上 寻找 ， 直 到 找到 匹配 的 处 理 器 ， 或 者 到 达 一 个 
本 地 帧 ， 或 者 线程 由 于 未 捕获 异常 而 终止 。 

实际 上 对 于 未 捕获 异常 ，VM 为 应 用 程序 提供 了 最 后 的 处 理 机 会 。 每 个 Java Thread 和 
ThreadGroup 可 以 注册 一 个 “未 捕获 异常 处 理 器 ”, 这 个 线程 抛 出 的 未 捕获 异常 会 被 传递 给 这 个 
处 理 函数 ， 首 先是 Thread 的 处 理 函 数 ， 然 后 如 果 线 程 没 有 注册 这 个 处 理 函 数 的 话 ， 就 轮 到 
ThreadGroup 的 处 理 函 数 。Thread 也 可 以 注册 一 个 “默认 未 捕获 异常 处 理 器 "” ， 如 果 Thread 
和 ThreadGroup 都 没有 注册 它们 的 处 理 函数 的 话 ， 它 就 会 处 理 未 捕获 异常 。 

搜索 匹配 异常 处 理 器 的 伪 代 码 看 起 来 就 像 下 面 这 样 。 这 个 过 程 是 破坏 式 的 , 也 就 是 说 展开 的 
栈 就 被 弹出 丢弃 了 。 

Exc_handler* thread_find_exception_handler(Frame_context* frame, 

jobject exc_obj) 


// 如 果 第 一 个 帧 是 本 地 帧 ， 跳 过 这 个 帧 
// 由 抛 出 异常 的 运行 时 辅助 建立 
Code_Type type = code_type(frame->eip) ; 
if( type != CODE_TYPE_JAVA ) { 
free_local_obj_handles(); 
frame = preceding_frame(frame) ; 
} 


while( !is_stack_bottom(frame) ) { 
type = code_type(frame->eip) ; 


if( type != CODE_TYPE_JAVA ){ 
// 情况 1: 本 地 帧 ， 
// 存储 异常 到 线程 局 部 存储 中 
thread_set_pending_exception( exc ) 
return NULL; 
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// Java 帧 
JIT_info* info = info_of_pc(frame->eip) ; 
int num_handlers = info->num_exc_handlers; 


for(int i=0; i<num_handlers; i++) { 
Exc_handler* handler = info->exc_handler[i]; 
if( !thandler ) continue; 
if(ip_in_range(handler, frame->eip) && 
exc_is_assignable(handler, exc_obj)) { 
// 情况 2: 找到 匹配 异常 处 理 器 


return handler; 


} 


frame_monitor_exit (frame) ; 
frame = preceding_frame(frame) ; 
} // while 


// 情况 3: 过 了 栈 底 ， 即 未 捕获 异常 
return NULL; 
} 


在 这 段 示 例 代 码 中 ， 函 数 在 3 种 情况 下 返回 。 
口 情况 1: 到 达 一 个 本 地 帧 ， 用 NULL 返回 值 表示 ( 即 没 有 找到 Java 异常 处 理 需 ) ， 并 且 帧 


没有 到 达 栈 底 。 
(handler == NULL && !is_stack_bottom(frame) ) 
O 情况 2: 找到 一 个 匹配 处 理 器 ， 用 返回 处 理 器 及 对 应 的 帧 上 下 文 表示 。 
(handler != NULL && !is_stack_bottom(frame) ) 
O 情况 3: 到 达 栈 底 ， 用 NULL 返回 值 及 帧 到 达 栈 底 表 示 。 
(handler == NULL && is_stack_bottom(frame) ) 











VM 会 根据 这 些 情况 决定 下 一 步 。 注 意 在 情况 1 中 ， 当 遇 到 本 地 帧 时 ，VM 不 需要 在 这 里 释 
放 帧 的 局 部 对 象 句柄 ,因为 它们 仍然 会 被 本 地 方法 使 用 。Java 到 本 地 封装 代码 会 在 本 地 方法 返回 
到 Java 世界 之 前 处 理 这 些 

如 果 一 个 帧 过 了 Java 运行 时 栈 底 , 那么 它 既 不 是 Java 帧 也 不 是 本 地 帧 。 它 是 一 个 传统 C 帧 ， 
通过 调用 一 个 Java 方 法 或 者 通过 本 地 到 Java 桥接 调用 一 个 本 地 方法 ， 它 启动 了 这 个 Java 线程 。 
它 可 以 使 用 JNIAPI“call method” pax. 

如 果 一 个 帧 是 Java tot, 那么 代码 类 型 是 Java 类 型 。 如 果 一 个 帧 是 本 地 帧 , 就 会 有 有 效 的 Java 
徐 指 针 值 , 指向 栈 上 由 Java 到 本 地 封装 建立 的 M2N_wrapper 数据 结构 。 所 以 检查 一 个 帧 是 否 过 
了 栈 底 的 函数 可 以 实现 如 下 。 


bool is_stack_bottom(Frame_context* frame) 


{ 
Code_Type type = code_type(frame->eip) ; 
if( type == CODE_TYPE_JAVA || frame->jcp != NULL) 
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return FALSE; 


return TRUE; 
} 


11.5 “控制 转移 
当 VM 完成 搜索 匹配 异常 处 理 器 之 后 ， 会 根据 结果 传递 控制 。 


11.5.1 ”控制 转移 操作 
前 文 已 经 提 到 ， 控 制 转移 只 发 生 在 Java 代码 中 。 在 抛 出 异常 的 Java 方法 内 ， 有 两 种 控制 转 


移 的 情况 。 


Co 情况 1: 控制 进入 到 同一 个 方法 内 的 匹配 异常 处 理 器 中 ， 异 常 对 象 作为 参数 。 

D 情况 2， 如果 同 一 个 方法 内 没有 匹配 的 异常 处 理 器 ， 这 个 方法 就 立即 完成 并 返回 到 它 的 调 
用 方 。 

在 情况 2 中 ， 控 制 转移 过 程 在 调用 方法 中 继续 递归 进行 ， 直 到 遇 到 下 列 情况 之 一 。 

O 情况 3: 如果 在 一 个 Java 方 法 中 找到 匹配 异常 处 理 器 ，VM 把 控制 转移 到 这 个 处 理 器 ， 
就 像 是 在 那个 方法 内 到 处 理 器 代码 入 口 点 的 一 个 跳 转 。 操 作 数 栈 已 经 清理 ， 只 留 下 异 党 
对 象 。 

口 情况 4: 如 果 遇 到 一 个 本 地 帧 ，VM 把 控制 转移 到 这 个 本 地 方法 ， 就 像 是 从 Java 被 调用 方 
执行 突然 完毕 并 返回 到 本 地 到 Java 桥接 代码 一 样 ， 返 回 值 被 清除 掉 ， 异 常 对 象 保存 在 线 
程 局 部 对 象 存储 中 。 

O 情况 5: 如果 过 了 运行 栈 的 栈 底 ， 也 就 是 这 个 线程 最 初 被 调用 的 Java 方法 或 本 地 方法 的 前 
一 巾 ， 那 么 VM 会 以 对 待 情况 4 中 的 普通 本 地 栈 的 方式 处 理 这 种 情况 。VM 恢 复 本 地 代码 
的 执行 ， 就 像 是 控制 从 第 一 个 Java 方法 或 本 地 方法 中 返回 了 一 样 。 返 回 值 清除 ， 异 常 对 
象 保存 在 线程 局 部 存储 中 。 

本 地 方法 内 部 没有 控制 转移 ， 控 制 转移 也 永远 不 会 路 本 地 帧 。 

为 了 总 结 这 些 情况 , 我 们 可 以 根据 控制 转移 的 操作 语义 来 思考 它们 的 设计 。 所 有 这 些 情况 中 


的 操作 都 可 以 分 割 为 下 面 的 一 个 或 几 个 动作 。 


O 动作 1: 控制 转移 到 异常 处 理 器 。 这 个 动作 是 在 Java 方 法 内 部 的 。 

O 动作 2: 从 Java 方 法 被 调用 方 立 即 结束 。 这 个 动作 从 Java 方 法 中 返回 。 

口 动作 3: 恢复 执行 。 

前 面 的 情况 1 把 控制 转移 到 匹配 异常 处 理 器 并 恢复 执行 。 

情况 2 从 Java 方 法 中 突然 结束 。 注意 这 并 没有 形成 完整 的 控制 转移 过 程 。 它 必须 继续 其 他 动作 。 
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情况 3 从 Java 方法 中 一 个 接 一 个 地 立即 结束 ， 直 到 找到 匹配 的 异常 处 理 融 。 然 后 它 把 控制 
转移 到 这 个 处 理 顺 并 在 Java 代码 中 恢复 执行 。 


情况 4 从 Java 方法 中 一 个 接 一 个 地 立即 结束 ， 直 到 遇 到 本 地 帧 。 在 那里 ， 它 在 本 地 代码 中 
恢复 执行 。 

情况 5 从 Java 方法 中 一 个 接 一 个 地 立即 结束 ， 直 到 遇 到 Java 栈 底 。 在 那里 ， 它 在 本 地 代码 
中 恢复 执行 。 

K 11-1 给 出 了 不 同情 况 所 包含 的 动作 。 其 中 没有 列 出 情况 2， 因 为 它 不 是 一 个 完整 过 程 。 表 
格 中 的 标记 “X” 表 示 这 一 行 的 情况 包含 这 一 列 的 动作 。 所 有 情况 都 包含 动作 3“ 恢 复 执行 ”。 从 
KR 11-1 中 可 以 看 到 ， 情 况 4 和 情况 5 实际 上 是 同一 个 过 程 。 


表 11-1 控制 转移 中 涉及 的 操作 





te 1 转移 到 处 理 函 数 立即 结束 恢复 执行 
情况 1 X 一 X 
情况 3 X X x 
情况 4 一 - x nd 
情况 5 = 3 x 


我 们 可 以 通过 设计 这 3 个 动作 来 实现 控制 转移 。 在 实际 的 设计 中 ， 只 有 “恢复 执行 ”这 个 动 
作 实际 改变 了 应 用 程序 的 执行 。 其 他 两 个 动作 一 一 “转移 到 处 理 吨 数 ” 和 “立即 结束 ” 只 涉 
及 VM 操 作 ， 它 们 的 主要 任务 是 为 最 终 的 执行 恢复 准备 执行 上 下 文 。 





11.5.2 ”用 于 控制 转移 的 寄存 器 
要 在 目标 代码 中 恢复 执行 ，VM 需 要 为 目标 建立 执行 上 下 文 ， 包括 以 下 两 类 信息 。 
(D 控制 寄存 器 


口 线程 上 下 文 数据 : 线程 上 下 文 包 括 栈 指针 和 指令 指针 ， 这 里 还 包括 栈 数 据 。 这 些 是 标识 
一 个 控制 线程 的 最 基本 数据 。 为 了 实现 异常 控制 转移 ，VM 应 该 总 是 恢复 它们 。 在 X86 
中 ,它们 是 esp, eip 和 异常 对 象 。 如 果 目 标 在 本 地 代码 中 ， 那么 异常 对 象 保存 在 线程 
局 部 存储 中 。 如 果 目 标 在 Java 代码 中 ， 那 么 异常 对 象 会 作为 当前 帧 的 唯一 元 素 放 在 操作 
数 栈 上 。 

O 栈 帧 指针 : 它们 是 帧 基 指 针 和 Java PRE. AAR Java 帧 和 本 地 帧 恢复 正确 的 栈 
帧 ， 因 此 对 VM 而 言 是 必需 的 。 为 了 实现 异常 控制 转移 ，VM 应 该 总 是 恢复 这 部 分 数 
据 。 在 我 们 的 讨论 中 ,它们 是 ebp 和 jcp。 

由 于 控制 转移 只 发 生 在 Java 帧 中 ，jcp 看 起 来 似乎 没有 被 触 碰 。 但 是 在 实际 的 实现 中 ， 
控制 转移 的 源 通常 是 在 顶层 帧 上 有 一 个 M2N_wrapper AY VM 代码 。 它 会 被 弹出 栈 , 这 样 
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就 会 触 碰 到 jcp。 它 应 该 被 恢复 到 指 回 下 一 个 Java 帧 徐 ， 或 者 如 果 当 前 Java WE 
一 个 的 话 ， 它 应 该 被 设置 为 NULL。 
(2) 数据 寄存 带 
口 被 调用 方 保存 寄存 器 : 如 果 目 标 是 本 地 代码 ， 在 恢复 执行 之 前 的 最 后 一 个 动作 就 是 立即 
结束 被 调用 方 Java 方法 。 然 后 被 调用 方 保 存 寄 存 融 在 目标 代码 中 是 被 假设 为 活跃 的 ， 因 
为 在 调用 返回 时 恢复 这 些 数据 是 被 调用 方 的 责任 。 如 果 目 标 是 Java 代码 ， 决 定 被 调用 方 
保存 寄存 器 恢复 是 JIT 编 译 器 的 责任 。 在 我 们 的 讨论 中 ， 被 调用 方 保 存 寄 存 器 包括 ebx, 
edi, esi 和 ebp。 
口 调用 方 保存 寄存 器 : 如 果 目 标 是 本 地 代码 ， 调 用 方 保存 寄存 器 由 调用 方 在 调用 到 Java 方 
法 之 前 处 理 ， 在 调用 点 之 后 不 能 假定 它们 为 活跃 。 所 以 不 需要 为 目标 代码 恢复 调用 方 保 
存 寄存 器 。 如 果 目 标 是 Java 代码 ， 决 定 调用 方 保 存 寄 存 器 恢复 是 JIT 编译 右 的 责任 。 在 
我 们 的 讨论 中 ， 调 用 方 保存 寄存 器 是 eax、ecx 和 edx 
VM 不 能 简单 地 只 通过 查看 所 有 需要 的 寄存 器 在 目标 帧 中 的 内 容 就 恢复 它们 的 值 可 以 按照 
和 栈 展开 同样 的 方式 来 恢复 控制 寄存 器 ， 即 esp 、eip、ebp 和 jcp， 这 部 分 我 们 已 经 介绍 过 
其 他 寄存 器 还 需要 更 多 的 工作 


11.5.3 ”数据 寄存 器 恢复 


本 节 讨 论 两 个 动作 中 的 数据 寄存 需 恢复: Java 方 法 的 立即 结束 , 以 及 控制 转移 到 异常 处 理 需 。 

1. Java 方法 的 立即 结束 

在 Java 方法 立即 结束 这 个 动作 中 ， 控 制 流 看 起 来 就 像 是 进入 紧 跟 着 一 个 调用 的 代码 ， 被 调 
用 的 则 是 立即 结束 的 Java 方 法 ( 即 被 调用 方 )。 被 调用 方 可 能 会 根据 自己 的 使 用 情况 保存 被 调用 
方 保 存 寄存 器 。 如 果 它 没有 使 用 任何 被 调用 方 保存 寄存 器 , 也 可 以 不 保存 。 有 些 未 被 保存 的 被 调 
用 方 保存 寄存 器 可 能 会 被 被 调用 方 的 被 调用 方 保存 ,其 至 在 栈 的 更 上 面 ， 直 到 顶层 帧 ( 即 异常 抛 
出 帧 )。 在 顶层 帧 中 ， 可 以 确定 所 有 的 被 调用 方 保 存 寄 存 需 都 被 保存 了 。 

口 如 果 控 制 转移 源 是 运行 时 辅助 ， 所 有 的 被 调用 方 保存 寄存 器 都 由 Java 到 本 地 封装 保存 在 

栈 上 的 M2N_wrapper 中 。 
O 如 果 控 制 转移 源 是 硬件 异常 处 理 孔 数 ， 所 有 的 被 调用 方 保存 寄存 融 都 由 OS 保存 在 异常 
上 下 文中 ， 并 传递 给 异常 处 理 函 数 。 

为 了 恢复 所 有 被 调用 方 保 存 寄存 器 ， 当 VM 开始 栈 展 开 的 时 候 ， 必须 从 顶层 帧 恢复 它们 。 当 
顶层 帧 弹出 的 时 候 ， 所 有 被 调用 方 保存 寄存 器 都 已 经 被 赋值 注意, 这些 值 还 没有 真正 被 加 载 进 
入 寄存 器 。 帧 上 下 文中 有 指针 指向 这 些 保 存 了 的 寄存 器 的 栈 槽 位 。 直 到 动作 3“ 恢 复 执 行 ”发 生 
的 时 候 才 加 载 这 些 寄存 器 。 


当 控制 转移 逻辑 继续 一 个 接 一 个 地 立即 结束 Java 方 法 的 时 候 ，VM 会 执行 破坏 式 栈 展开 。 从 
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之 前 弹出 帧 恢复 的 一 些 寄存 器 可 能 会 被 后 面 弹出 帧 的 恢复 覆盖 , 而 另外 一 些 可 能 一 直 有 效 并 被 目 
标 代码 使 用 。 

栈 展开 过 程 保证 了 被 调用 方 保存 寄存 器 会 被 正确 恢复 。 它 不 仅 横 拟 了 从 顶层 帧 向 下 直到 目标 
帧 方法 的 返回 操作 ， 还 模拟 了 被 调用 方 保存 寄存 器 恢复 操作 。( 对 方法 返回 操作 的 模拟 实际 上 恢 
复 了 控制 寄存 融 。) 

图 11-2 展示 了 当 VM 为 控制 转移 完成 了 栈 展 开 之 后 的 最 终 帧 上 下 文 状态 。 它 为 目标 帧 恢复 
执行 确定 了 寄存 器 数据 。 帧 上 下 文 包含 指向 栈 中 保存 的 寄存 囊 的 指针 。 







Frame_context 









ptr callee 1 


stack-ptr 


[Al PC 





图 11-2” 栈 展开 完成 后 的 帧 上 下 文 状态 

以 上 的 过 程 在 栈 展 开 过 程 中 实现 , 9.2.2 节 中 已 经 讨论 过 , 其 中 展示 了 preceding_frame() 
的 示例 代码 。GC 也 需要 它 来 枚 举 所 有 被 调用 方 保 存 寄 存 器 ， 以 此 获得 可 能 的 对 象 引用 。 

2. 控制 转移 到 异常 处 理 器 

对 于 控制 转移 到 匹配 异常 处 理 器 这 个 动作 ，VM 需要 向 JIT 编译 器 询问 恢复 哪些 寄存 器 ， 以 
及 从 哪里 来 恢复 这 些 值 。 这 与 模拟 一 个 方法 返回 不 同 。 因 为 这 个 动作 发 生 在 一 个 方法 内 部 ， 所 以 
JIT 知道 异常 处 理 器 和 它 所 对 应 的 try 块 之 间 的 所 有 数据 依赖 细节 。 

口 如 果 异 常 是 被 同一 方法 内 的 硬件 错误 触发 的 ， 在 出 错 点 保存 全 部 异常 上 下 文 。 如 果 和 需要 

的 话 ，VM 可 以 向 异常 处 理 需 提供 这 些 内 容 。 
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O 如 果 异 常 是 被 运行 时 辅助 主动 抛 出 触发 的 ， 这 种 情况 和 方法 调用 一 样 ， 可 以 从 运行 时 辅 
助 的 帧 中 恢复 所 有 被 调用 方 保存 寄存 器 。 


举例 来 说 ，Apache Harmony 默认 情况 下 使 用 eax 寄存 器 把 异常 对 象 传递 给 异常 处 理 器 ， 而 
不 是 放 在 运行 时 栈 上 。 蜡 常 处 理 器 中 可 以 随意 使 用 其 他 调用 方 保存 寄存 器 。 


如 果 蜡 常 由 非 目 标 方法 的 另 一 个 方法 抛 出 ,“ 立 即 结束 Java 方 法 ”动作 之 后 是 “控制 转移 到 
异常 处 理 器 "”。 控 制 流 看 起 来 就 像 是 异常 被 立即 结束 的 方法 所 抛 出 ， 该 方法 位 于 同一 方法 中 目标 
异常 处 理 需 的 try 块 中 。 


11.5.4 ”控制 寄存 器 修正 


在 确定 了 目标 异常 处 理 带 之 后 , 不 能 直接 使 用 帧 上 下 文 的 内 容 恢复 执行 , 因为 它 只 反映 了 一 
个 立即 返回 的 方法 的 上 下 文 。 直 接 使 用 它 只 能 恢复 到 方法 调用 之 后 的 执行 。 


VM 应 该 修改 帧 上 下 文 来 反映 异常 处 理 器 执行 的 需求 。VM 请 求 JIT 编译 器 调整 帧 上 下 文中 
的 两 个 寄存 器 : 一 个 是 指令 eip， 它 应 该 指向 异常 处 理 器 人 口 点 ; 另 一 个 是 栈 指针 esp， 它 应 该 
指向 异常 处 理 器 要 开始 的 栈 位 置 。 这 两 个 寄存 器 定义 了 线程 控制 。 


一 旦 通过 函数 threaa_finaq_exception_handqler() 确 定 了 目标 帧 ，VM 需要 如 下 操作 : 


Exc_handler* handler; 
handler = thread_find_exception_handler(frame, exc_obj); 


if( handler ){ // 找到 一 个 匹配 异常 处 理 器 
// 得 到 处 理 函 数 的 栈 项 地 址 
uint32 ebp = *(frame->p_ebp) ; 
uint32 stack_depth = handler->entry_stack_depth; 
frame->esp = ebp + stack_depth; 


// 得 到 处 理 函 数 的 入 口 点 
frame->eip = handler->entry_code_address; 


} 


// 通过 eax A HM RGRAY HH 

frame->p_eax = (uint32*) &exc_obj; 

VM_Thread*.self = current_thread(); 

self->jcp = frame->jcp; 

这 个 函数 找到 栈 顶 槽 位 和 异常 处 理 器 入 口 地 址 , 然后 把 它们 赋 给 线程 上 下 文 寄存 器 ( esp 和 
eip )。 最 后 ， 它 把 异常 对 象 地 址 赋 给 sax， 然 后 设置 当前 Java 艇 指针。 


11.5.5 “执行 恢复 


准备 好 帧 上 下 文 之 后 ，VM 可 以 把 控制 传递 给 这 个 上 下 文 ， 在 本 地 方法 或 者 异常 处 理 器 恢复 
执行 。 不 同 的 异常 抛 出 源 用 不 同 的 方式 来 恢复 执行 。 
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1. 主动 异常 恢复 
如 果 异 常 由 运行 时 辅助 主动 抛 出 而 触发 , 可 以 用 下 面 的 逻辑 转移 控制 。 它 直接 赋值 所 有 的 寄 
存 器 ， 并 最 终 跳 转 到 目标 代码 。 


void vm_transfer_control (Frame_context* context) 
{ 

// RAN ARE FRE 

uint32 ebx_var = *(context->p_ebx) ; 

uint32 edi_var = *(context->p_edi); 

uint32 esi_var = *(context->p_esi); 


// 调用 方 保存 寄存 器 


uint32 eax_var = *(context->p_eax) 


// 控制 的 帧 与 线程 

uint32 ebp_var = *(context->p_ebp) ; 
uint32 esp_var = context->esp; 
uint32 eip_var = context->eip; 


// 恢复 寄存 器 

__asm{ 
mov ebx_var -> ebx 
mov edi_var -> edi 
mov eSi_var -> esi 


mov eax_var -> eax 
mov ebp_var -> ebp 


// 现在 生效 

mov esp var -> ecx 
mov eip var -> edx 
mov ecx -> esp 
jump edx 





} 

要 改变 当前 执行 流 ,， 在 当今 的 处 理 器 设计 中 通常 有 3 种 方式 ， 分 别 映射 为 3 类 指令 : call, 
jump 和 return。 对 于 异常 控制 转移 ，call 指令 是 不 合适 的 ， 因 为 它 会 把 一 个 多 余 的 返回 地 址 
EERE, 目标 代码 对 其 一 无 所 知 也 不 想 处 理 。jump 和 return 指令 都 可 以 用 于 异常 控制 转移 。 
以 上 代码 使 用 jump。 如 果 要 使 用 return 指令 ， 就 把 目标 指令 指针 放 在 栈 顶 ， 然 后 以 上 代码 的 
最 后 四 条 指令 〈 以 加 粗 代 码 体 显示 ) 可 以 编写 为 如 下 内 容 。 


// 现在 生效 

// ecx 中 有 栈 指针 
mov esp_var -> ecx 
// edx 有 指令 指针 
mov eip_var -> edx 
// 把 返回 eip RR 
sub 4 -> ecx 

mov edx -> [ecx] 
mov ecx -> esp 

ret 
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使 用 return 指令 有 一 个 小 优点 , 那 就 是 VM 在 转移 控制 的 时 候 , 可 以 不 需要 占用 ecx 和 edx 
这 两 个 调用 方 保 存 寄存 器 。 如 果 包 括 调用 方 保存 寄存 器 在 内 的 所 有 寄存 上 需 都 需要 被 恢复 的 话 , 这 
是 很 方便 的 。 在 某 些 平台 上 ， 也 可 以 用 把 栈 顶 元 素 弹 出 到 指令 指针 的 pop 指令 来 模拟 return 


指令 。 


2. 硬件 错误 异常 恢复 


如 果 异 常 从 硬件 错误 处 理 函 数 抛 出 ，VM 可 以 重用 硬件 出 错 机 制 来 进行 控制 转移 。 现 代 操 作 
系统 让 开发 者 有 机 会 用 异常 处 理 函 数 处 理 硬件 错误 。 它们 向 异常 处 理 函 数 提供 了 异常 上 下 文 (所 
有 寄存 带 的 内 容 )， 然 后 处 理 函 数 可 以 通过 检查 异常 上 下 文 来 判断 发 生 了 什么 。 如 果 需 要 的 话 ， 
这 个 处 理 函 数 也 可 以 修改 异常 上 下 文 。 


当 异 常 处 理 函 数 返 回 的 时 候 , 控制 流 可 以 恢复 到 异常 上 下 文 指定 的 状态 。 例如 ,如果 异常 处 
理 消 数 改 变 了 上 下 文中 的 返回 指令 指针 , 执行 就 恢复 到 新 的 指令 指针 指向 的 新 位 置 。 一 个 常规 做 
法 就 是 , 异常 处 理 函 数 递 碱 返回 指令 指针 , 使 其 指向 它 的 前 一 条 指令 ,从 而 在 出 错 问 题解 决 之 后 
重新 执行 出 错 指 令 一 一 比如 在 缺 页 的 页 面 被 加 载 之 后 。 


硬件 错误 处 理 函 数 的 异常 抛 出 过 程 可 以 使 用 这 种 机 制 。VM 可 以 修改 异常 上 下 文 来 满足 异常 
抛 出 目标 代码 的 需求 。 然 后 从 异常 处 理 函 数 中 返回 就 自动 把 控制 传递 给 了 目标 代码 。 示 例 代 码 如 
下 所 示 。 异 常 处 理 函 数 调用 因数 event_transfer_control() 来 修改 上 下 文 。 


Linux 版 本 : 


void event_transfer_control(Frame_context* target_context, 
void* fault_context) 
{ 
ucontext_t* resume = (ucontext_t*)fault_context; 
Frame_context* target = target_context; 


resume->uc_mcontext .gregs [REG_EAX] 
resume->uc_mcontext .gregs [REG_EDI] 
resume->uc_mcontext .gregs [REG_ESI] 
resume->uc_mcontext .gregs [REG_EBX] 


* (target->p_eax) ; 
*(target->p_edi); 
* (target->p_esi); 
* (target->p_ebx) ; 
* (target->p_ebp) ; 
target->eip; 

target->esp; 


resume->uc_mcontext .Gregs [REG_EBP] 
resume->uc_mcontext.gregs [REG_EIP] 
resume->uc_mcontext.gregs [REG_ESP] 


a | GRR | SER | | PS 


} 
Windows 版 本 : 


void event_transfer_control (Frame_context* target_context, 
PCONTEXT fault_context) 
PCONTEXT resume = fault_context; 
Frame_context* target = target_context; 


resume->Hax = *(target->p_eax) ; 
resume->Edi = *(target->p_edi); 
resume->Esi = *(target->p_esi); 
resume->Ebx = *(target->p_ebx) ; 
resume->Ebp = *(target->p_ebp) ; 
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resume->Eip = target->eip; 
resume->Esp = target->esp; 





} 

从 关于 JVM 中 异常 处 理 的 讨论 中 ,我们 可 以 看 到 运行 时 开销 可 能 是 很 高 的 ， 主 要 是 由 于 栈 
展开 和 异 津 处 理 带 匹配 。 其 中 可 能 会 经 历 两 次 栈 展开 : 一 次 用 于 获得 异常 帧 轨迹 , 男 一 次 用 于 异 
常 处 理 器 搜索 。 有 可 能 把 它们 优化 为 一 轮 栈 展开 。 


另外 一 个 优化 是 在 之 前 的 异常 抛 出 之 后 缓存 栈 轨迹 或 栈 展 开 结果 。 然 后 , 后 面 的 异常 抛 出 也 
许 就 可 以 通过 为 给 定 的 指令 指针 搜索 缓存 来 重用 数据 ， 假 定 在 两 次 异常 抛 出 实例 中 栈 保 持 稳定 。 

如 来 编 详 带 能 够 确定 , 抛 出 的 异常 会 被 同一 个 方法 中 的 异常 处 理 顺 捕获 , 也 可 以 完全 避免 栈 
展开 。 然 后 编译 天 可 以 建立 一 条 从 抛 出 点 到 捕获 点 的 直接 执行 路 径 。 


11.5.6 ”未 捕获 异常 


如 打 异 常 找 不 到 匹配 的 异常 处 理 带 并 最 终 遇 到 栈 底 ， 执 行 会 返回 到 所 有 Java/ 本 地 方法 被 调 
用 之 前 的 状态 。 这 种 情况 下 ，VM 基本 上 会 终止 当前 Java 线程 。 

前 文 已 经 提 到 过 ， 线 程 可 以 注册 一 个 “未 捕获 异常 处 理 器 "， 或 者 安装 有 “默认 未 捕获 异常 
fb edie”. “4 Java 线程 从 VM 中 移 除 (detach ) 的 时 候 ， 它 们 会 被 调用 ， 以 未 捕获 异常 对 象 作为 
参数 。 由 于 未 捕获 异常 处 理 带 是 一 个 Java 或 者 本 地 方法 ， 这 个 调用 实际 上 重启 了 这 个 Java 线程 
的 执行 。 这 个 执行 可 能 导致 其 他 异常 ,但 不 会 引起 循环 异常 处 理 ， 因 为 不 管 未 捕获 异常 处 理 需 是 
否 抛 出 异常 ，VM 都 会 确保 这 次 执行 回 到 Java 线程 移 除 过 程 。 


例如 ，Thread.detach() 的 Java 代码 可 以 像 下 面 这 样 编写 。 当 目标 线程 即将 终止 的 时 候 ， 
VM 会 通过 JNIAPI 调 用 这 个 方法 。 


// 参数 是 未 捕获 异常 
void detach(Throwable uncaught) { 
bay f 
if (unmeaught != null) { 
// 调用 注册 的 处 理 函 数 
getUncaughtExceptionHandler().invoke(this, uncaught) ; 
} 
} finally { 
// A ThreadGroup 中 移 除 当前 线程 
group.remove (this); 
synchronized(this) { 
// 设置 当前 线程 为 死亡 状态 
isAlive = false; 
notifyAll (); 


} 
} 


任何 在 get Uncaught Except ionHandler () .invoke() 中 触发 的 异常 会 被 忽略 , 并 且 执行 
会 进入 finally 块 来 终止 当前 this 线程 。 
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对 很 多 Java 和 虚拟 机 ( VM ) 开发 者 来 说 , 终结 (finalization ) 与 弱 引 用 是 两 个 复杂 的 主题 。 
它们 与 内 存 管理 及 线程 交互 紧密 相关 。 


12.1 终结 


Java 要 求 ， 对 于 任何 覆盖 了 java.lang.Object 中 默认 finalize() 方 法 的 对 象 ， 在 它 不 
可 达 之 后 ,回收 之 前 必须 执行 它 的 finalize() 方 法 。 其 思路 是 让 应 用 程序 开发 者 在 知道 对 象 变 
得 不 可 达 时 有 机 会 执行 一 些 了 结 工作 。VM 中 支持 终结 的 逻辑 如 下 。 

(1) 当 一 个 类 被 加 载 后 ，VM 检查 它 或 它 的 超 类 是 否 实现 了 finalize() 方 法 。 如 果实 现 了 

的 话 ，VM 就 把 这 个 类 标记 为 具有 终结 器 (finalizer )。 

(2) 当 分配 某 个 类 的 一 个 对 象 后 , HSRC AR GC ) 检查 这 个 类 是 否 有 终结 需 。 如 果 有 的 话 ， 
就 把 这 个 对 象 链 入 到 一 个 列表 中 ， 也 就 是 “终结 器 对 象 列 表 ”。 

(3) 当 一 次 回收 开始 ， 并 且 标 记 了 所 有 的 可 达 对 象 时 ,在 GC 回收 死亡 对 象 之 前 ， 它 会 遍历 
“终结 需 对 象 列表 ”检查 对 象 的 活性 状态 。 如 果 一 个 对 象 已 经 死去 ,那么 GC 就 把 它 从 
“终结 器 对 象 列表 ”中 移 除 ， 并 把 它 加 入 到 “可 终结 ( finalizable ) 对 象 列 表 ” 中 。 对 于 
“终结 融 对 象 列 表 ” 中 的 活跃 对 象 ， 如 果 这 个 对 象 被 GC 移动 过 的 话 ， 可 能 还 需要 把 指 问 
它 的 指针 更 新 为 指向 新 位 置 。 换 句 话 说 ， 原 来 “终结 器 对 象 列表 ”中 的 活路 对象 和 死亡 
对 象 都 会 被 GC 保留， 只 不 过 放 在 两 个 不 同 的 列表 中 。 

(4) 完成 前 面 的 步骤 之 后 ，GC 复活 “可 终结 对 象 列表 ”中 的 死亡 对 象 。 它 遍历 这 个 列表 中 的 
每 个 对 象 ， 将 其 标记 为 活跃 ， 然 后 递归 标记 它 的 所 有 可 达 对 象 为 活跃 。 对 于 追踪 -复制 
GC 来 说 , 标记 一 个 对 象 为 活跃 意味 着 把 这 个 对 象 转发 到 新 位 置 , 并 把 所 有 指 回 它 的 引用 
更 新 为 指向 新 位 置 。 然 后 把 “可 终结 对 象 列表 ”传递 给 VM. 

(5) 修改 器 恢复 执行 后 “可 终结 对 象 列表 ”中 的 所 有 对 象 都 准备 好 了 执行 finalize() 方 法 ， 
并 由 VM 决定 何 时 以 及 如 何 执 行 它们 。 通 常 VM 使 用 专门 的 (一 个 或 多 个 ) “终结 ” 
( finalizing ) 线程 来 执行 。 因 为 它们 执行 Java 方法 ， 所 以 被 看 作 修 改 占 。( 这 意味 着 GC 
应 该 像 对 待 普通 应 用 程序 线程 一 样 暂 停 并 枚 举 它们 。 ) 
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(6) 就 在 对 象 被 终结 之 前 ， 也 就 是 执行 finalize() 方 法 之 前 ， 这 个 对 象 从 “可 终结 对 象 列 
表 ” 中 被 移 除 。 终 结 操作 可 能 使 这 个 对 象 变 得 再 次 可 达 ， 比 如 ， 可 能 把 它 的 引用 安装 到 
某 个 可 达 对 象 的 某 个 字段 中 。 

(7) 当 一 个 已 终结 对 象 过 一 段 时 间 后 再 次 变 得 不 可 达 的 时 候 , GC 会 直接 回收 它 , 不 再 检查 它 
是 否 有 终结 器 ， 因 为 它 已 经 不 在 “终结 器 对 象 列 表 ” 中 。 任 何 有 终结 器 的 对 象 只 有 在 出 
生 的 时 候 才 能 被 放 和 人 “终结 需 对 象 列 表 "。 一旦 这 个 对 象 从 这 个 列表 中 被 移 除 ,， 它 就 变 成 
了 普通 对 象 ， 就 像 没 有 终结 器 一 样 。 

(8) VM 关闭 的 时 候 ， 它 会 试图 完成 所 有 的 对 象 终结 。 

上 述 逻 辑 很 简单 。 只 有 一 点 需要 指出 ， 即 何 时 以 及 如 何 执行 finalize() 方 法 。Java 中 没有 
规定 终结 的 时 间 点 或 时 间 期 限 。 如 果 应 用 程序 代码 在 一 个 对 象 的 初始 化 器 (initializer ) 中 获得 一 
个 资源 ,在 它 的 终结 器 中 释放 这 个 资源 ,那么 并 不 能 保证 这 个 资源 会 被 及 时 释放 。 这 个 资源 可 能 
会 被 持 有 很 入, 引起 严重 的 资源 泄露 , 包括 可 终结 对 象 本 身 引 起 的 内 存 泄 露 。 因 此 ， 并 不 建议 在 
终结 天 中 释放 关键 资源 。 最 好 避免 使 用 终结 器 ,或 者 只 把 它 作为 一 个 备用 解决 方案 , 检查 是 否 有 
任何 应 该 已 经 被 释放 的 资源 还 未 释放 ， 并 释放 它们 。 

在 修改 关 从 回收 中 恢复 之 后 , 使 用 专门 的 修改 器 来 执行 终结 会 有 一 些 后 果 。 首 先是 潜在 的 正 
确 性 问题 。 终结 器 彼此 之 间 可 能 并 发 执行 , 也 可 能 与 其 他 应 用 程序 代码 并 发 执行 ,因此 如 果 它 们 
访问 共享 资源 的 话 就 需要 同步 。 

一 次 回收 识别 的 同一 个 回收 上 下 文中 的 所 有 可 终结 对 象 , 有 些 VM 实现 可 能 会 在 恢复 修改 器 
之 前 对 其 执行 终结 。 这 能 够 避免 一 些 并 发 复杂 性 , 但 可 能 会 引发 更 严重 的 问题 。 一 个 终结 器 需要 
的 锁 可 能 被 一 个 修改 顺 线 程 持 有 ,而 这 个 修改 器 线程 已 经 因为 这 次 回收 被 暂停 。 这 个 锁 只 有 在 回 
收 恢复 修改 器 之 后 才能 够 被 释放 。 这 是 一 个 死 锁 。 


如 果 有 很 多 可 终结 对 象 等 待 被 终结 ,那么 它们 可 能 占用 了 大 量 堆 空间 ,为 了 释放 这 些 堆 空间 ， 
应 该 执行 终结 器 。 执行 这 些 终结 器 可 能 需要 很 多 处 理 器 周期 。 内 存 消 耗 和 处 理 器 开销 之 间 需 要 取 
得 平衡 。 终 结 这 些 对 象 的 速度 需要 与 终结 器 对 象 的 生成 速度 成 比例 。 


如 果 终 结 融 对 象 创建 的 速度 快 于 它们 的 终结 速度 ， 一 个 解决 方案 是 增加 专用 终结 线程 的 数 
量 , 提高 终结 速度 。 另 一 个 解决 方案 是 降低 终结 器 对 象 的 生成 速度 , 同时 保持 终结 线程 数量 稳定 。 
前 一 个 解决 方案 可 能 会 出 现 太 多 修改 器 彼此 之 间 苋 争 CPU 的 情况 ， 而 后 一 个 解决 方案 可 会 阻塞 
一 些 应 用 程序 线程 ， 这 样 它们 才能 把 CPU 让 给 终结 线程 。 如 前 所 述 ， 后 一 个 解决 方案 可 能 会 导 
致死 锁 。 

当 可 终结 对 象 被 移动 到 “可 终结 对 象 列表 ” 中 之 后 ,在 这 个 回收 周期 内 ,它们 从 应 用 程序 中 
是 不 可 达 的 , 尽管 其 中 一 些 可 能 是 其 他 可 终结 对 象 可 达 的 。 复活 不 会 使 得 这 些 应 用 程序 不 可 达 对 
象 变 得 可 达 ， 而 是 帮助 在 堆 中 保留 这 些 不 可 达 对 象 不 被 GC 回收 。 


当下 一 个 回收 周期 开始 的 时 候 ,“ 可 终结 对 象 列表 ”中 的 某 些 对 象 可 能 已 经 被 终结 ， 并 从 列 
表 中 移 除 ， 而 另 一 些 还 没有 。 至 于 没有 被 终结 的 可 终结 对 象 , 其 中 有 一 些 可 能 因为 终结 操作 而 再 
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次 变 得 对 应 用 程序 可 达 。 那 些 应 用 程序 不 可 达 的 可 终结 对 象 应 该 作为 将 被 “复活 ”的 对 象 被 GC 
枚 举 ， 并 保持 在 堆 中 不 被 回收 。 


要 保持 这 些 可 终结 对 象 的 “复活 ”状态 , 一 个 解决 方案 是 把 “可 回收 对 象 列表 ”复制 到 一 个 
Java 数据 结构 中 并 传 给 终结 线程 。 因 为 终结 线程 是 Java 线程 ， 所 以 这 些 链 接 到 活路 数据 结构 中 
的 对 象 自然 而 然 也 就 是 活跃 的 了 。 另 一 个 解决 方案 是 GC 在 回收 周期 开始 时 显 式 枚 举 这 个 “可 终 
结对 象 列表 ” 


12.2 为何 需要 弱 引 用 


在 高 级 语言 中 , 对 象 生命 期 由 垃圾 回收 器 自动 管理 。 程序 员 不 可 能 也 不 被 鼓励 了 解 一 个 对 象 
是 否 死亡 。 根据 可 达 性 分 析 ， 如 果 一 个 对 象 被 应 用 程序 引用 ， 那么 它 就 是 活跃 的 。 如 果 一 个 对 象 
已 死亡 , 那么 应 用 程序 中 没有 指向 这 个 对 象 的 引用 。 换 名 话说 ， 当 一 个 应 用 程序 查询 一 个 对 象 的 
活性 时 ， 这 个 对 象 必然 是 活跃 的 ,因为 这 个 应 用 程序 应 该 持 有 一 个 指向 对 象 的 引用 才能 查询 。 如 
果 对 象 已 经 死亡 , 那么 这 个 应 用 程序 永远 不 会 知道 这 个 事实 ,因为 应 用 程序 没有 对 这 个 对 象 的 引 
用 ， 也 就 没 法 查询 它 。 

可 以 通过 终结 这 种 方法 大 概 了 解 一 个 对 象 是 否 不 可 达 , 因为 这 个 对 象 可 以 定义 在 对 象 不 可 达 
的 时 候 执行 的 finalize()。 但 是 , 它 有 一 个 严重 的 缺点 : 执行 finalize() 意 味 着 这 个 对 象 必 
须 保持 为 可 达 。 因 此 ,尽管 有 时 候 可 以 用 finalize() 来 清理 一 些 这 个 对 象 使 用 过 并 且 仍 然 持 有 
的 资源 ， 但 它 并 不 适用 于 “管理 对 象 生 命 周 期 ”这 个 目标 。 最 根本 的 原因 是 ，finalize() 是 对 
象 “之 内 ”的 方法 。 要 管理 对 象 的 生命 周期 ， 最 好 使 用 对 象 “之 外 ”的 方法 。 以 下 列举 了 3 个 终 
结 融 无 法 胜任 的 示例 。 

示例 1: 浏览 器 页 面 缓存 

如 果 应 用 程序 了 解 对 象 的 活性 ， 并 且 程 序 员 可 以 检查 死亡 对 象 ， 那 么 有 时 候 会 很 方便 。 

一 个 例子 是 浏览 器 的 “页 面 缓存 ”。 浏 览 器 为 访问 过 的 页 面 保存 缓存 。 如 果 再 次 访问 这 

个 页 面 ,， 而 这 个 页 面 还 没有 过 期 的 话 , 就 可 以 直接 从 页 面 缓存 中 加 载 它 的 内 容 。 缓存 的 

内 容 可 以 被 清理 而 不 会 有 任何 问题 ， 在 这 个 意义 上 缓存 的 内 容 实际 是 死亡 的 。 但 浏览 器 

仍然 持 有 对 它们 的 引用 ， 这样 在 需要 的 时 候 就 可 以 复活 它们 。 为 了 实现 这 个 目的 ， 需 要 

有 一 个 语言 构件 用 来 表达 “虽然 死亡 但 是 仍然 可 以 引用 ”的 语义 。 

示例 2: URL 和 页 面 快 照 

即使 是 用 于 资源 管理 , finalize() 也 并 非 总 是 有 效 的 。 有 时 候 资 源 并 没有 被 对 象 使 用 ， 

而 只 是 关联 于 这 个 对 象 的 生存 期 ， 因 此 这 个 资源 不 会 在 对 象 死亡 后 继续 生存 。 仍 以 浏览 

器 为 例 , 开发 者 可 以 把 一 个 页 面 Snapshot 对 象 与 对 应 的 URL 对 象 相关 联 。 当 这 个 URL 

对 象 死 亡 的 时 候 ， 这 个 Snapshot 也 应 该 死亡 。 如 果 这 个 UR 对 象 保持 一 个 对 这 个 

Snapshot 对 象 的 单 例 引用 的 话 ， 可 能 很 容易 实现 这 个 语义 ,但 这 在 现实 中 通常 是 不 可 
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能 的 ， 比 如 ， 如 果 URL 对 象 被 定义 为 final His, 


将 URL 和 Snapshot 对 象 集成 到 第 三 个 对 象 ( 比如 一 个 Page MR) 中 , 也 不 可 能 实现 

这 个 语义 。Page 对 象 持 有 一 个 到 URL 的 引用 , 使 得 这 个 URL 对 象 总 是 可 达 的 ， 除 非 这 

个 Page 对 象 本 身 死亡 。 这 实际 上 把 URL 管理 的 问题 转移 到 了 Page 对 象 ， 并 没有 解决 

这 个 问题 

用 URL 的 finalize() 把 Page 中 的 Snapshot 引用 置 空 似乎 解决 了 这 个 问题 ， 因 为 

finalize() R# URL 不 可 达 的 时 候 才 会 被 调用 。 但 问题 是 这 样 做 并 不 能 保证 被 终结 的 

对 象 URL 会 被 回收 

示例 3: 浏览 器 的 标签 页 对 象 

还 有 一 个 生存 期 管理 问题 就 是 , 程序 如 何 得 知 一 个 对 象 确 已 死亡 ,也 就 是 说 ,不仅 是 不 

Wik, 而 且 是 已 经 被 终结 并 且 不 可 复活 。 让 我 们 再 次 以 浏览 器 开发 为 例 。 当 浏览 器 用 户 

关闭 一 个 旧 的 标签 页 时 , 这 个 标签 页 对 象 仍 可 能 在 内 存 中 存留 g 很 长 时 间 ， 并 占用 大 量 的 

ge 在 开发 浏览 器 的 时 候 ， 开 发 者 可 能 希望 ， 在 

允许 打开 新 标签 页 之 前 ,能 确定 旧 标 签 页 会 被 回收 ,这 显然 无 法 通过 finalize() 实现 ， 

因为 finalizel() 无 法 判断 对 象 是 否 ER 

Java 引入 了 “引用 对 象 "， 为 程序 员 提供 了 一 种 显 式 方式 ， 用 来 从 对 象 “之 外 ”管理 对 象 的 
ee 引用 对 象 可 以 被 看 作 一 个 指 回 对 象 的 指针 ， 而 这 个 指针 本 身 用 对 象 来 表示 。 引 用 对 象 有 

y 字段 持 有 指 问 目标 对 象 的 引用 。 这 里 目标 对 象 称 为 所 指 对 象 ( referent )。 引 用 对 象 的 日 的 是 
we 一 个 到 所 指 对 象 的 引用 ， lige al rent abe atone 换 句 话说， 引用 对 象 
是 一 个 只 能 使 被 指向 对 象 被 引用 ， 但 不 能 使 被 指向 对 象 保持 活跃 的 “指针 ”。 即 使 这 个 对 象 被 认 
为 已 经 死亡 ， 代 码 也 可 以 从 这 个 “指针 ”中 提取 出 这 个 对 象 。 

如 果 一 个 对 象 只 能 通过 引用 对 象 可 达 ， 那 么 这 个 对 象 实际 上 已 经 死亡 ，GC 可 以 自行 处 置 ， 

spelen hes 应 用 程序 可 达 的 。 这 种 情况 下 称 这 个 对 象 为 “ 弱 可 达 ”( weakly reachable ) 

， 在 这 个 语 境 下 传统 的 “可 达 ” 称 为 “ 强 可 达 ”( strongly reachable )。 应 用 程序 可 以 在 GC 回 
nee 可 达 对 象 之 前 访问 它 。 要 访问 这 个 所 指 对 象 , 可 以 在 引用 对 象 上 调用 get O 动作 。 在 引用 对 
象 上 调用 clear () 动 作 可 以 把 引用 对 象 的 所 指 对 象 设置 为 空 。 

引用 对 象 可 以 解决 浏览 锅 开 发 中 的 上 述 问 题 

对 于 示例 1: 浏览 器 页 面 缓存 


浏览 器 管理 页 面 缓存 的 时 候 ， 可 以 使 用 引用 对 象 持 有 之 前 访问 过 的 页 面 的 缓存 内 容 。 当 
系统 内 存 不 足 的 时 候 , 缓存 内 容 被 看 作 已 经 死亡 ， 可 以 被 回收 。 当 同一 个 页 面 被 再 次 访 
问 的 时 候 , 浏览 器 可 以 检查 引用 对 象 , 判断 作为 它们 的 所 指 对 象 的 缓存 内 容 是 否 仍然 可 
用 。 如 果 可 用 的 话 ， 就 可 以 把 内 容 加 载 到 浏览 器 ,使 之 再 次 成 为 强 可 达 的 。 页 面 缓存 功 
能 只 是 优化 ， 用 于 减少 页 面 加 载 时 间 。 回 收 缓存 内 容 的 时 机 不 会 影响 浏览 器 的 正确 性 。 
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如 果 不 用 引用 对 象 实现 页 面 缓存 , 浏览 器 就 必须 根据 系统 内 存 状态 决定 何 时 以 及 如 何 回 

收 缓存 ， 这 就 违背 了 使 用 支持 GC 的 高 级 语言 编程 的 最 初 目 的 。 

对 于 示例 2: URL 与 页 面 快照 

在 浏览 器 为 它 的 URL 管理 快照 的 时 候 ， 它 可 以 把 URL 对 象 和 Snapshot 对 象 集成 放 在 

第 三 个 对 象 Page F, m Page 通过 引用 对 象 引 用 URL。 只 要 URL 对 象 对 应 用 程序 变 得 

不 再 可 达 ， 集 成 对 象 就 可 以 了 解 这 个 情况 ， 并 相应 地 把 Snapshot 引用 也 设置 为 空 。 

示例 3 的 问题 稍 后 再 讨论 ， 因 为 这 需要 对 引用 对 象 更 深入 的 理解 。 

实现 引用 对 象 的 思路 是 很 直观 的 。 因 为 它 基本 上 只 关乎 于 可 达 性 ， 所 以 实现 细节 主要 放 在 

GC 组 件 中 。 在 对 象 追 踪 过 程 中 ， 与 普通 情况 相 比 ， 要 区 别 对 待 引用 对 象 。 当 到 达 并 扫描 一 个 引 
用 对 象 的 时 候 ，GC 不 像 平常 一 样 标记 它 的 所 指 对 象 。 所 指 对 象 只 有 在 可 以 通过 一 条 没有 引用 对 
象 的 路 径 到 达 的 时 候 ， 才 会 被 标记 为 活跃 。 因 此 ， 引 用 对 象 处 理 主要 有 两 个 步骤 。 

(1) 在 对 象 追 踪 过 程 中 ， 把 除 (引用 对 象 的 ) 所 指 对 象 之 外 的 所 有 可 达 对 象 标记 为 活跃 ， 
除非 这 些 所 指 对 象 是 从 没有 引用 对 象 的 路 径 到 达 的 。 把 所 有 可 达 引 用 对 象 记录 在 一 个 
列表 中 。 

(2) 对 象 追踪 之 后 ， 遍 历 活 跃 引 用 对 象 列表 。 对 于 那些 所 指 对 象 没 有 被 标记 为 活跃 的 引用 
对 象 ， 把 所 指 对 象 字 段 设 置 为 null， 也 就 是 执行 clear () ， 这 样 被 引用 的 对 象 就 不 再 
可 达 。 

上 述 的 两 个 步骤 还 不 足以 满足 对 象 生存 期 管理 的 需要 , 因为 引用 对 象 的 实际 应 用 方式 之 间 也 

有 微妙 的 区 别 。 举例 来 说 , 只 要 内 存 情 况 允 许 , 页 面 缓 存 问 题 希望 在 缓存 中 尽 可 能 长 时 间 保 持 “ 死 
去 但 是 仍然 可 引用 ”的 对 象 ， 而 URL-Snapshot 问题 希望 在 URL 变 得 不 可 达 之 后 尽快 一 起 回收 
URL 和 Snapshot。 旧 标签 页 问题 希望 了 解 的 不 仅 是 旧 标 签 页 何 时 不 可 达 ， 而 且 还 有 何 时 能 够 保 
证 这 些 对 象 被 回收 ( 即 被 终结 并 且 不 能 再 复活 )。 


12.3 对象 生存 期 状态 


为 了 满足 引用 对 象 在 不 同 场景 下 的 需求 , Java 语 言 提供 了 3 种 引用 对 象 类 , BI softReference, 
WeakReference 和 PhantomReference。 引 用 对 象 可 以 是 它们 中 任何 一 个 的 实例 , 或 者 是 它们 
子 类 的 实例 。 我 们 用 “ 软 引 用 ”“ 弱 引用 ”和 “幻象 引用 ”( phantom-reference ) 来 分 别 表示 这 几 
种 引用 对 象 的 类 型 。 它 们 以 更 细 的 粒度 定义 了 ( 弱 ) 可 达 性 的 强度 。 从 最 强 到 最 弱 ， 弱 可 达 性 的 
强度 定义 如 下 。 

O 如 果 一 个 对 象 不 是 强 可 达 的 ， 但 能 通过 至 少 一 条 含有 软 引 用 的 路 径 可 达 ， 那 么 这 个 对 象 

是 软 可 达 的 。GC 可 以 决定 是 否 回收 一 个 软 可 达 对 象 。 当 内 存 不 足 的 时 候 ，GC 可 以 
clear () 这 个 软 引 用 对 象 ， 这样 它 们 的 所 指 对 象 就 可 以 被 回收 ,但 这 不 是 强制 性 的 。 
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口 如 果 一 个 对 象 既 不 是 强 可 达 的 也 不 是 软 可 达 的 ， 而 是 通过 至 少 一 条 含有 能 引用 的 路 径 可 
达 ， 那 么 这 个 对 象 是 弱 可 达 的 。 当 GC 确定 一 个 对 象 为 弱 可 达 之 后 ， 所 有 指向 这 个 对 象 
的 弱 引 用 对 象 都 应 该 被 clear () 。 之 后 这 个 对 象 变 为 可 终结 的 。 

O 如 果 一 个 对 象 不 是 强 可 达 的 ， 不 是 软 可 达 的 ， 也 不 是 弱 可 达 的 ， 而 是 通过 至 少 一 条 含有 
幻象 引用 的 路 径 可 达 ， 那 么 这 个 对 象 是 幻象 可 达 的 。 vaipa 已 经 被 终结 但 还 没 
有 被 回收 的 对 象 。 幻 象 引用 对 象 上 的 get () 操 作 总 是 返回 null， 这 意味 着 幻象 可 达 对 象 
SIMDERSRDMLT EAM, GOKPIPRUM RAUNT DOR, SOAK RATER TIA 
对 象 可 在 GC clear () 它 们 的 引用 对 象 之 前 被 get () 到 。 


为 了 简化 讨论 ， 我 们 用 非 强 可 达 来 统一 指 代 上 面 3 种 情况 。 


12.3.1 ”对象 状态 转换 


图 12-1 中 展示 了 对 象 生 存 期 的 一 些 状 态 。 注 意 ， 为 了 集中 关注 讨论 要 点 ， 这 个 图 虽然 是 正 
确 的 ， 但 不 是 完整 的 ， 其 中 省 略 了 很 多 其 他 状态 和 转换 箭头 。 





图 12-1 对 象 生 命 周 期 内 可 能 的 状态 转换 


图 12-1 中 的 虚线 箭头 用 于 那些 只 有 默认 终结 器 的 对 象 ， 稍 后 会 讨论 它们 。 图 中 的 其 他 转换 
列举 如 下 。 

OA: 对 象 刚 分 配 (new) 出 〈 可 带 有 非 默 认 终结 器 ) 

OB: 对 象 构 造 希 执行 完毕 。 

OC: 对 象 的 引用 保存 在 应 用 程序 上 下 文中 。 

口 D: 对 这 个 对 象 的 所 有 强 引 用 已 经 清空 。 这 个 对 象 变 成 通过 带 软 引用 路 径 软 可 达 的 。 
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DE: 对 这 个 对 象 的 所 有 强 引 用 已 经 清空 。 这 个 对 象 变 成 通过 带 弱 引用 路 径 弱 可 达 的 

OF: 到 这 个 对 象 的 所 有 软 可 达 路 径 孝 被 清除 。 这 个 对 象 仍然 通过 弱 引 用 可 达 . 

OG: 到 这 个 对 象 的 所 有 软 可 达 路 径 都 被 清除 。 如 果 它 有 非 默认 终结 融 ， 已 经 准备 好 被 终结 。 

OH: 到 这 个 对 象 的 所 有 弱 可 达 路 径 都 被 清除 。 如 果 它 有 非 默认 终结 名 ,那么 它 已 经 准备 

好 被 终结 。 

Ol: 一 个 强 可 达 对 象 由 于 没有 非 强 可 达 路 径 ， 直 接 变 为 可 终结 状态 。 

OJ: 一 个 可 终结 对 象 可 能 在 终结 之 后 青 次 变 为 强 可 达 

口 K: 一 个 已 终结 对 象 ， 对 应 用 程序 不 可 达 。 

OL: 一 个 被 复活 并 终结 的 强 可 达 对 象 ， 再 次 成 为 应 用 程序 不 可 达 。 

OM: 一 个 应 用 程序 不 可 达 对 象 通过 幻象 引用 成 为 幻象 可 达 。 

箭头 M 使 得 幻象 可 达 区 别 于 另外 两 种 弱 可 达 性 。 从 其 他 引用 对 象 不 可 达 的 对 象 可 能 由 于 终 
结 而 变 为 可 达 。 但 对 幻象 引用 来 说 ， 这 是 不 可 能 的 。 对 象 一 旦 成 为 幻象 可 达 ， 就 再 也 不 可 能 对 应 
用 程序 可 达 。 对 于 带 有 非 默认 终结 器 的 对 象 ， 没 有 从 软 可 达 或 弱 可 达 直 接 到 达 幻 象 可 达 的 转换 。 

只 有 默认 终结 器 的 对 象 ， 没 有 “可 终结 ”或 “已 终结 不 可 达 ” 步 又 。 转 换 如 图 12-2 所 示 





图 12-2 ”不 带 默认 终结 器 的 对 象 的 状态 转换 


虚线 箭头 列举 如 下 。 

OO: 强 可 达 对 象 变 为 应 用 程序 不 可 达 ， 同 时 仍然 通过 幻象 引用 幻象 可 达 。 

OP: 到 对 象 的 所 有 软 可 达 路 径 都 被 清除 。 这 个 对 象 仍然 通过 幻象 引用 幻象 可 达 。 

口 Q: 到 对 象 的 所 有 弱 可 达 路 径 都 被 清除 。 这 个 对 象 仍然 通过 幻象 引用 幻象 可 达 。 

显然 软 引 用 最 适合 于 开发 前 面 提 过 的 页 面 缓存 机 制 , 因为 它 是 由 GC 来 决定 是 否 回收 软 可 达 
对 象 。 只 要 堆 空 间 足 够 ，GC 可 以 一 直 保 留 它们 。 
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可 以 通过 弱 引 用 把 其 他 对 象 的 生存 周期 关联 到 目标 所 指 对 象 , 这 样 就 可 以 在 所 指 对 象 变 为 应 
用 程序 不 可 达 的 时 候 , 清空 对 其 他 对 象 的 引用 。 这 个 时 间 点 对 于 应 用 程序 来 说 是 已 知 的 。 接 下 来 
将 解释 它 是 如 何 知 道 的 。 因 此 对 于 URL-Snapshot 问题 ， 弱 引用 就 是 一 个 很 好 的 解决 工具 。 


12.3.2 引用 队列 


Java API 定义 了 一 个 引用 队列 类 ，ReferenceQueue。 如 果 引 用 对 象 创建 时 注册 了 一 个 
ReferenceQueue (或 其 子 类 ) 实例 , 那么 在 这 个 引用 对 象 的 所 指 对 象 变 为 应 用 程序 不 可 达 的 时 
候 ，VM SASH enqueue () 动作 把 它 放 人 这 个 队列 。 也 就 是 说 ， 软 引用 对 象 和 弱 引 用 对 象 在 被 
cleaz1() 之 后 会 被 放 和 人 各 自 的 引用 队列 中 。 而 幻象 引用 对 象 在 其 所 指 对 象 变 为 幻象 可 达 之 后 ， 在 其 
所 指 对 象 字段 被 clear () 之 前 , 会 被 放 人 它 的 引用 队列 中 。 不管 哪 种 情况 , 在 enqueue () 之 后 引用 
对 象 上 的 get O 动作 都 返回 null。 引 用 队列 帮助 应 用 程序 了 解 它 感 兴趣 的 对 象 何 时 变 得 不 可 达 ， 然 
后 可 以 采取 相应 动作 。 应 用 程序 可 以 在 这 个 队列 上 使 用 pol1 () 或 者 removed () 来 出 队 引用 对 象 。 


引用 队列 使 得 幻象 引用 可 以 实现 它 的 日 的 ,幻象 引用 的 存在 给 了 应 用 程序 一 个 机 会 来 执行 需 
要 对 象 不 可 达 的 后 终结 处 理 , 或 者 执行 一 些 只 有 在 目标 对 象 确 定 死 亡 时 期 望 的 操作 。 它 应 该 通过 
与 引用 队列 合作 ， 以 一 种 灵活 得 多 的 方式 奉 代 终结 机 制 。 

幻象 可 达 对 象 存在 于 回收 过 程 之 中 , 并 且 已 经 被 终结 ,对象 只 有 在 幻象 引用 被 最 终 clear () 
或 幻象 引用 本 身 变 成 不 可 达 之 后 才能 被 回收 。 当 一 个 幻象 引用 的 所 指 对 象 是 幻象 可 达 的 时 候 , 它 
被 enqueue ()， 然 后 应 用 程序 可 以 出 队 这 个 幻象 引用 ， 并 了 解 到 这 个 所 指 对 象 已 经 不 可 达 这 个 
事实 。 现 在 我 们 对 浏览 器 设计 中 的 旧 标 签 页 问题 有 了 一 个 解决 方案 。 

对 于 示例 3: 浏览 器 的 标签 页 对 象 

幻象 引用 适用 于 旧 标 签 页 问题 。 当 浏览 器 发 现 持 有 旧 标 签 页 对 象 的 幻象 引用 已 经 被 

enqueue() J, 它 就 知道 这 个 旧 标 签 页 确 已 死亡 。 它 可 以 从 队列 中 移 除 这 个 幻象 引用 对 

Z, ， 执 行 所 有 必需 的 操作 ， 然 后 丢弃 指向 旧 标 签 页 对 象 的 最 后 引用 。 现 在 它 就 已 经 准备 

好 打开 新 标签 页 。 


幻象 对 象 要 有 一 个 引用 队列 才能 发 挥 作用 , 因为 使 用 幻象 引用 唯一 的 目的 就 是 了 解 某 个 对 象 
确 已 死亡 。 创 建 幻象 引用 对 象 却 不 注册 引用 队列 是 没有 意义 的 。 


12.3.3 引用 对 象 状 态 转换 


引用 对 象 的 生命 周期 与 所 指 对 象 不 同 。 引 用 对 象 为 了 所 指 对 象 而 创建 ， 当 所 指 对 象 不 再 强 可 
达 的 时 候 ， 就 被 enqueue () 。 一 个 引用 对 象 的 创建 不 能 没有 所 指 对 象 。 由 于 引用 对 象 的 存在 就 
是 为 了 它 的 所 指 对 象 ， 当 所 指 对 象 不 是 强 可 达 的 时 候 , 长 时 间 保 持 一 个 引用 对 象 可 达 是 没有 多 少 
意义 的 ,除非 为 了 告诉 应 用 程序 它 的 所 指 对 象 已 不 可 达 。 这 就 是 引用 队列 存在 的 原因 ,， 它 集合 了 
应 用 程序 关心 其 所 指 对 象 可 达 性 的 那些 引用 对 象 。 一 旦 应 用 程序 从 队列 中 出 队 这 些 引 用 对 象 , 就 
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青 也 无 法 从 队列 到 达 它 们 , 之 后 处 理 它们 是 应 用 程序 的 责任 。 但 是 既然 应 用 程序 永远 不 能 为 引用 
对 象 设置 新 的 所 指 对 象 , 在 了 解 到 出 队 引 用 对 象 的 所 指 对 象 确 实 不 可 达 之 后 , 继续 保持 出 队 引 用 
对 象 就 没有 意义 了 。 


基于 上 面 的 讨论 ， 引 用 对 象 的 生命 周期 如 图 12-3 所 示 。 


ny m 
eh 
ear vara | 





图 12-3 引用 对 象 的 状态 转换 


图 12-3 中 的 转换 列举 如 下 。 


QA: 引用 对 象 被 创建 ( 参数 为 一 个 所 指 对 象 ， 以 及 对 非 幻象 引用 来 说 可 选 的 一 个 引用 队列 )。 
OB: 当 一 个 引用 对 象 的 引用 保存 在 程序 上 下 文中 时 ， 这 个 引用 对 象 成 为 可 达 的 。 它 的 所 
首 对 象 是 强 可 达 的 。 

引用 对 象 的 所 指 对 象 变 为 非 强 可 达 。 

OD: 如 果 引 用 对 象 不 是 幻象 引用 ， 这 个 引用 对 象 被 清除 ， 所 指 对 象 变 为 可 终结 ( 带 非 默认 

Aah ae ) 或 者 可 回收 (不 带 非 默认 终结 器 ) o 

QE: 如 果 引 用 对 象 不 是 幻象 引用 ， 引 用 对 象 被 人 队 。 如 果 它 创建 的 时 候 注 册 了 引用 队 

列 ， 这 个 引用 对 象 会 被 放 和 队列。 否则， 入 队 操 作 什么 也 不 做 。 

OF: 如 果 引 用 对 象 是 幻象 引用 ， 它 就 在 被 清除 之 前 入 队 。 

引用 对 象 从 引用 队列 出 队 ， 并 被 让 它 出 队 的 应 用 程序 代码 引用 。 

Ou: ,引用 对 象 变 为 应 用 程序 不 可 达 ， 准备 好 被 回收 。 如 果 它 是 幻象 引用 ， 应 用 程序 在 回 
收 它 之 前 可 以 清除 它 ， 也 可 以 不 清除 它 。 如 果 同 一 个 所 指 对 象 的 所 有 幻象 引用 对 象 都 被 
清除 ， 这 个 所 指 对 象 立即 变 为 可 回收 。 否则 ， 幻象 引用 和 所 指 对 象 一 起 变 为 可 回收 。 

O1: 如果 引 用 对 象 创建 时 没有 注册 引用 队列 ， 这 个 引用 对 象 不 在 任何 队列 中 ， 变 为 不 可 达 。 
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OJ: 引用 对 象 直接 变 为 不 可 达 ， 因 为 应 用 程序 失去 了 对 它 的 引用 。 
普通 对 象 和 引用 对 象 的 状态 转换 可 以 帮助 我 们 实现 引用 对 象 支 持 。 


12.4 引用 对 象 实现 


比 要 复杂 得 多 ， 但 采用 的 设计 原则 还 是 一 样 的 。 这 些 步 又 集成 在 GC 和 VM 组件 中 。 

(1) 当 一 个 类 被 加 载 后 ，VM 检查 它 或 它 的 任何 超 类 是 否 为 任何 引用 类 型 。 如 果 是 的 话 ，VM 
给 这 个 类 打上 某 个 引用 类 型 标签 : 软 引 用 、 弱 引用 或 幻象 引用 。 

(2) 在 堆 追 踪 过 程 中 处 理 引 用 对 象 。GC 标记 除 所 指 对 象 之 外 的 所 有 可 达 对 象 。GC 为 标记 了 
的 引用 对 象 构造 3 个 检查 表 ， 每 个 表 对 应 一 个 引用 类 型 。 

(3) 在 堆 追 踪 之 后 处 理 软 引 用 对 象 。GC 遍历 软 引 用 对 象 检 查 表 。 对 于 这 次 回收 ，GC 需要 决 
定 如 何 处 理 软 引 用 对 象 ， 也 就 是 应 该 把 它们 作为 普通 对 象 还 是 引用 对 象 处 理 。 

口 如 果 一 个 软 引 用 对 象 被 作为 普通 对 象 处 理 ，GC 把 它 从 软 引 用 检查 列表 中 移 除 ， 并 标记 
它 和 它 所 有 的 递归 可 达 对 象 ， 包 括 到 达 的 软 引用 对 象 。 

口 如 果 一 个 软 引 用 对 象 被 作为 引用 对 象 处 理 ， 就 检查 这 个 软 引 用 对 象 的 所 指 对 象 是 否 被 标 
记 。 如 果 没 有 被 标记 的 话 ， 意 味 着 这 个 所 指 对 象 对 应 用 程序 不 可 达 ， 就 clear () 这 个 软 引 
用 。 否 则 ， 就 把 这 个 ( 持 有 一 个 活跃 所 指 对 象 ) 的 软 引 用 对 象 从 软 引 用 检查 列表 中 移 除 。 

(4) 总 是 把 弱 引 用 对 象 作 为 引用 对 象 处 理 ， 无 论 是 被 clear ()( 如 果 所 指 对 象 没 有 被 标记 ) 
还 是 从 列表 中 移 除 ( 如 果 所 指 对 象 被 标记 )。 

(5) 处 理 可 终结 对 象 。GC 遍历 “终结 器 对 象 列表 ”( 列表 中 的 对 象 在 被 创建 的 时 候 添加 )。 
GC 从 列表 中 的 对 象 开始 追踪 堆 , 将 从 它们 出 发 的 所 有 可 达 对 象 复 活 。 把 可 终结 对 象 (”“ 终 
结 器 对 象 列 表 ” 中 为 死亡 ， 但 现在 又 被 复活 的 那些 ) 从 “终结 器 对 象 列 表 ” 中 移出 并 放 
入 “可 终结 对 象 列表 ”中 。 

O 注意 这 个 复活 过 程 可 能 会 复活 一 些 引 用 对 象 。 没 有 规定 指明 被 复活 的 引用 对 象 是 否 应 该 
被 添加 到 引用 对 象 检 查 列表 。 这 由 实现 决定 。 当 一 个 引用 对 象 被 复活 的 时 候 ， 它 的 所 指 
对 象 并 没有 被 复活 。 换 名 话说 ， 被 复活 的 引用 对 象 被 clear () 了 。 这 是 必要 的 ， 否 则 新 
复活 的 引用 对 象 就 会 错过 前 面 步 又 的 处 理 。 所 指 对 象 的 可 达 性 不 应 该 依赖 于 其 引用 对 象 
的 复活 。 对 于 幻象 引用 ， 反 正 它们 的 所 指 对 象 是 不 能 被 get () 到 的 。 为 了 保持 一 致 性 ， 
建议 不 要 把 复活 的 引用 对 象 放 回 到 检查 列表 中 。 

(6) 处 理 幻 象 引用 对 象 的 方式 与 处 理 其 他 引用 类 型 略 有 不 同 。 需 要 遍历 幻 象 引 用 检查 列表 来 
找到 是 否 有 任何 所 指 对 象 被 标记 了 。 如 果 所 指 对 象 被 标记 ， 意 味 着 它 是 强 可 达 的 ， 就 从 
检查 列表 中 移 除 这 个 幻象 引用 对 象 。 和 否则 ， 如 果 所 指 对 象 不 是 强 可 达 的 ， 它 也 不 会 像 其 
他 引用 类 型 一 样 被 清除 。 
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O 没有 规定 指明 ， 当 所 指 对 象 的 幻象 引用 被 复活 的 时 候 ， 是 否 应 该 复活 这 个 所 指 对 象 ， 以 
及 复活 是 否 包 括 所 有 从 所 指 对 象 递归 可 达 的 对 象 。 笔 者 认为 clear () 这 个 幻象 引用 没有 
任何 问题 。 
O 幻象 引用 处 理 放 在 终结 之 后 ， 因 为 它 必 须 把 复活 对 象 当 作 活 跃 对 象 处 理 。 这 一 点 很 重 
要 ,这样 的 话 系统 对 活跃 对 象 的 定义 就 更 宽泛 了 ,包括 那些 只 对 终结 右 可 访问 的 对 象 。 
(7) 检查 列表 中 所 有 剩 下 的 项 目 都 有 活跃 的 引用 对 象 。 幻象 引用 对 象 没有 被 clear () ， 其 他 
的 则 被 清除 了 。GC 把 它们 从 列表 中 移 除 。 如 果 在 引用 对 象 创建 的 时 候 注册 了 引用 队列 ， 
它 会 被 enqueue () 到 这 个 引用 队列 中 。 这 通常 由 专门 的 (一 个 或 多 个 ) 线程 执行 。 如 果 
没有 注册 引用 队列 ， 这 个 引用 对 象 就 变 为 可 回收 。 
引用 对 象 人 队 之 后 就 不 再 被 VM 特殊 处 理 (与 其 他 非 引 用 对 象 相 比 ) 它们 何 时 以 及 如 何 出 
队 由 应 用 程序 来 决定 。 和 常见 的 情况 是 , 应 用 程序 通过 出 队 引 用 队列 检查 所 指 对 象 是 否 死亡 , 然后 
把 引用 对 象 丢 给 GC 处 理 。 


注意 ， 尽 管 我 们 使 用 clear () 和 enqueue () 来 指 代 引 用 对 象 处 理 中 的 具体 操作 , 但 GC 在 
执行 这 些 操作 的 时 候 不 一 定 实际 调用 引用 对 象 的 clear () 和 enqueue () 方 法 。GC 会 直接 执行 
这 些 操 作 。 对 于 clear () ，GC 将 引用 对 象 的 所 指 对 象 字 段 清空 为 null; 对 于 enqueue(), GC 
把 引用 对 象 放 入 引用 队列 中 。 这 些 方法 没有 被 调用 ,都 是 直接 执行 相应 操作 的 ,Java 方 法 clear () 
和 enqueue () 仅 供应 用 程序 代码 调用 。 这 么 做 是 为 了 避免 clear () 和 enqueue() 中 实现 的 某 些 
不 可 预期 的 行为 ， 因 为 它们 是 public 方法， 所 以 可 能 被 应 用 程序 覆盖 。GC 不 想 冒 险 使 用 用 户 
定义 的 语义 。 但 这 可 能 会 让 应 用 程序 开发 者 感到 迷惑 。 应 用 程序 在 期 望 所 指 对 象 表现 为 不 可 达 的 
时 候 ， 可 以 在 它 还 是 可 达 的 时 候 就 调用 enqueue ( ) 。 一 个 引用 只 能 被 enqueue() 一 次 ， 所 以 这 
些 语义 可 以 保持 一 致 。 

就 像 finalize() 方 法 一 样 ，Java 中 没有 规定 enqueue ( ) 方 法 执行 的 时 间 点 或 时 间 期 限 。 

如 果 应 用 程序 代码 把 一 些 重 要 资源 与 一 个 对 象 相关 联 , 并 期 望 一 旦 这 个 对 象 死亡 就 释放 这 些 
资源 ， 那 么 这 个 应 用 程序 最 好 不 要 依赖 enqueue ( ) 操作 (通过 检查 引用 队列 ),。 换 句 话 说 ， 这些 
资源 最 好 按 这 种 方式 来 安排 : 一 旦 目标 对 象 变 为 非 强 可 达 ， 这 个 资源 就 同时 自动 变 为 不 可 达 , 不 
管 引 用 对 象 是 否 已 经 enqueue () 。 这 种 情况 下 ， 应 用 程序 可 以 用 弱 引 用 来 管理 这 个 目标 对 象 ， 
试图 get () 到 它 来 检查 目标 对 象 是 否 已 死亡 ， 然 后 处 理 相 关联 的 资源 。 

如 果 不 依赖 于 引用 队列 ,潜在 风险 就 是 开发 者 可 能 get () 到 目标 对 象 并 且 不 小 心 保持 了 这 个 
引用 , 因此 保持 了 这 个 对 象 活跃 的 同时 又 释放 了 关联 的 资源 。 使 用 幻象 引用 会 防止 get () 返回 目 
标 对 象 ， 但 是 它 从 不 返回 这 个 对 象 ， 所 以 应 用 程序 也 不 能 通过 get () 它 来 检查 它 是 否 死 亡 

与 终结 不 同 的 是 ，GC 的 enqueue () 操 作 不 是 Java 代码 执行 ， 因 此 不 需要 使 用 Java 线程 来 人 
o 它 可 以 在 修改 天 恢复 之 前 或 之 后 执行 。 与 终结 类 似 的 是 , 需要 考虑 人 队 线 程 的 数量 和 负载 均衡 。 

引用 对 象 移动 到 引用 队列 后 , 即使 应 用 程序 失去 了 对 它们 的 直接 引用 , 在 它们 出 队 并 且 它 们 
的 引用 被 应 用 程序 清除 为 null 之前， 它们 都 是 从 应 用 程序 可 达 的 . 
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12.5 引用 对 象 处 理 顺 序 


软 引 用 对 象 处 理 的 设计 决策 是 实现 定义 的 ， 对 此 没有 有 具体 规定 。VM 运行 应 用 程序 的 时 候 有 
多 种 选择 。 
口 部 分 普通 : 在 一 次 回收 中 ， 把 某 些 软 引 用 对 象 当 作 普 通 对 象 处 理 ， 其 余 的 作为 引用 对 象 
处 理 。 
O 回收 普通 : 在 一 次 回收 中 ， 把 所 有 软 引 用 对 象 当 作 普 通 对 象 处 理 ; 在 男 一 次 回收 中 ,把 
所 有 软 引用 对 象 当 作 引 用 对 象 处 理 。 
口 总 是 普通 : 总 是 把 所 有 软 引 用 对 象 当 作 普 通 对 象 处 理 。 
口 总 是 引用 : 总 是 把 所 有 软 引 用 对 象 当 作 引 用 对 象 处 理 。 

“部 分 普通 ”是 容易 出 错 的 方案 ， 应 该 避免 使 用 ， 这 一 点 稍 后 会 解释 。 另 外 三 种 方案 的 任何 
一 个 都 符合 规范 。 

常见 的 设计 中 通常 选择 “回收 普通 ”方案 。 次 回收 (minor GC ) 可 以 把 所 有 引用 对 象 当 作 普 
通 对 象 处 理 ， 主 回收 (major GC ) 则 把 所 有 引用 对 象 当 作 引用 对 象 处 理 。 次 回收 的 命名 是 相对 于 
主 回 收 来 说 的 ,前 者 只 回收 部 分 堆 以 得 到 更 高 的 回收 效率 ， 后 者 通常 回收 整个 堆 。 因 为 软 引 用 的 
所 指 对 象 比 另 外 两 种 引用 类 型 的 预期 有 更 强 的 可 达 性 , 在 次 回收 中 保留 它们 是 有 道理 的 。 这 不 是 
唯一 的 设计 选择 , 仅仅 是 一 个 建议 。 对 于 这 个 设计 , 之 前 的 步骤 需要 进行 如 下 调整 。 在 次 回收 中 ， 
没有 单独 的 软 引用 对 象 处 理 。 软 引用 对 象 处 理 和 其 他 普通 对 象 一 起 合并 到 堆 追 踪 中 。 

(1) VM 标记 加 载 类 的 引用 类 型 。 

(2) 在 堆 追 踪 过 程 中 处 理 引 用 对 象 。 


口 在 次 回收 中 ，GC 标记 所 有 可 达 对 象 ， 弱 引用 对 象 和 幻象 引用 对 象 的 所 指 对 象 除外 。 换 
句 话说 ， 软 引用 对 象 被 当 作 普 通 对 象 处 理 ， 软 可 达 对 象 被 标记 为 强 可 达 。 标 记 的 弱 引 用 
对 象 和 幻象 引用 对 象 ( 不 是 它们 的 所 指 对 象 ) 则 记录 在 两 个 检查 列表 中 ， 每 种 引用 类 型 
一 个 列表 。 

O 在 主 回 收 中 ， 标 记 除 所 指 对 象 之 外 的 所 有 可 达 对 象 。 标 记 的 引用 对 象 需要 构造 三 个 检查 
列表 来 记录 ， 每 种 引用 类 型 一 个 列表 。 

(3) 在 主 回收 中 把 软 引 用 对 象 作 为 引用 对 象 处 理 。 在 堆 追 踪 之 后 , 遍历 软 引用 对 象 检查 列表 。 
检查 每 个 软 引 用 对 象 的 所 指 对 象 是 否 被 标记 。 如 果 没 有 标记 ， 意 味 着 这 个 所 指 对 象 是 应 
用 程序 不 可 达 的 ， 并 clear () 这 个 软 引 用 对 象 ; 否则 ， 从 软 引用 检查 列表 中 移 除 这 个 软 
引用 对 象 ( 持 有 一 个 活跃 的 所 指 对 象 )。 

(4) 把 弱 引 用 对 象 作为 引用 对 象 处 理 。 在 次 回收 中 ， 它 在 堆 追 踪 之 后 被 处 理 。 在 主 回收 中 ， 
它 在 软 引用 处 理 之 后 被 处 理 

(5) 处 理 可 终结 对 象 。 

(6) 处 理 幻象 引用 对 象 。 
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(7) 把 三 个 检查 列表 中 的 所 有 剩余 项 目 传递 给 VM., 
(8) VM enqueue () 这 些 引 用 对 象 。 


注意 弱 引 用 处 理 总 是 在 软 引用 处 理 之 后 .这 正 是 因为 某 些 VM 实现 可 能 在 一 次 回收 中 区 别处 
理 软 引 用 对 象 和 弱 引 用 对 象 , 在 “回收 善 通 ” 和 “总 是 普通 ”设计 中 就 是 这 样 。 这 个 顺序 是 为 了 
确保 正确 处 理 多 个 非 强 可 达 路 径 到 达 同 一 个 所 指 对 象 , 或 者 链 式 非 强 可 达 路 径 到 达 一 个 所 指 对 象 
的 情况 。 

图 12-4a 展示 了 通过 多 条 非 强 可 达 路 径 可 以 到 达 同 一 个 所 指 对 象 的 情况 ， 其 中 一 条 路 径 是 软 
可 达 的 ， 另 一 条 路 径 是 弱 可 达 的 。 当 回收 把 软 可 达 对 象 当 作 普 通 对 象 处 理 时 , 在 堆 追 踪 过 程 中 这 
条 软 可 达 路 径 把 所 指 对 象 R 标 记 为 强 可 达 。 然 后 在 弱 引 用 处 理 中 , 由 于 这 个 所 指 对 象 可 达 , 弱 引 
用 对 象 W 从 它 的 检查 列表 中 被 移 除 。 这 没有 问题 。 


如 果 按 相反 顺序 处 理 , 那么 首先 弱 引 用 处 理 认为 所 指 对 象 R 不 可 达 并 把 它 清除 , 然后 软 引用 
处 理 把 它 当 作 强 可 达 ， 这 是 互相 矛盾 的 。 之 后 弱 引 用 对 象 W1 会 人 队 ， 导 致 应 用 程序 相信 引用 R 
已 死亡 , 然后 就 清理 了 相关 资源 , 这些 资源 应 该 只 在 所 指 对 象 R 不 可 达 的 时 候 才 清理 。 当 回收 把 
软 引 用 对 象 当 作 引用 对 象 处 理 的 时 候 ， 不 同 的 处 理 顺 序 没 有 区 别 。 

图 12-4b 展示 了 所 指 对 象 本 映 也 是 引用 对 象 的 情况 。 当 回收 把 软 引 用 对 象 当 作 普 通 对 象 处 理 
时 , 首先 弱 引 用 对 象 WI 由 于 软 可 达 而 被 标记 为 活跃 。 然后 弱 引 用 处 理发 现 所 指 对 象 R 不 可 达 并 
清理 它 。 这 没有 问题 。 





图 12-4 引用 类 型 处 理 顺序 : (a) 多 路 径 引 用 ; (b) 链 式 路 径 引 用 


如 果 处 理 过 程 顺序 相反 ,那么 弱 引 用 对 象 W1 只 通过 一 个 引用 对 象 可 达 ， 所 以 没有 被 GC 标 
记 ， 因 此 一 开始 弱 引 用 处 理 没有 处 理 WwW1。 然 后 软 引 用 处 理 找到 了 弱 引 用 对 象 W 并 把 它 标记 为 
强 可 达 。 由 于 所 指 对 象 R 没 有 被 标记 为 可 达 , 在 活跃 弱 引 用 W 上 的 get () 操作 可 能 导致 出 平 意 
料 的 错误 。 当 回收 把 软 引 用 对 象 当 作 引 用 对 象 处 理 的 时 候 ， 不 同 的 处 理 顺 序 没 有 区 别 。 


在 “部 分 普通 ”设计 中 , 一 次 回收 中 对 软 引 用 对 象 有 不 同 的 处 理 方式 ， 实 际 上 如 果 两 个 引用 
对 象 都 是 软 引 用 对 象 ， 那么 可 能 会 出 现 同样 的 问题 。 举 例 来 说 ， 如 图 12-5 所 示 ， 其 中 S1 是 一 个 
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被 当 作 普 通 对 象 处 理 的 软 引 用 对 象 , S2 是 一 个 被 当 作 引用 对 象 处 理 的 软 引用 对 象 。S1 和 S2 的 不 
同 处 理 顺序 可 能 会 导致 不 一 致 的 结果 ， 有 时 结果 还 会 出 错 。 这 就 是 为 什么 不 推荐 “部 分 普通 ” 设 
计 的 原因 。 更 进一步 说 ， 首 先 就 不 要 导致 多 路 径 或 链 式 路 径 非 强 可 达 的 情况 发 生 。 

总 结 一 下 ,对 象 处 理 必须 遵循 可 达 性 从 强 到 弱 的 顺序 , 任何 情况 下 都 不 能 与 之 相反 。 因 为 幻 
象 引 用 保持 了 幻象 可 达 所 指 对 象 而 没有 清除 它们 , 所 以 有 人 可 能 认为 它 比 其 他 清理 了 自己 的 所 指 
对 象 的 引用 类 型 ( 即 软 可 达 的 和 弱 可 达 的 ) 具有 更 强 的 可 达 性 。 这 种 理解 实际 上 是 不 正确 的 。 幻 
象 引用 不 会 因为 保留 所 指 对 象 而 导致 任何 前 述 问题 , 因为 幻象 可 达 的 所 指 对 象 是 应 用 程序 不 能 访 
问 的 。 保 留 了 被 访问 对 象 这 一 点 不 会 改变 它 的 可 达 性 强度 。 

在 引用 计数 系统 中 ， 最 大 的 挑战 是 循环 引用 ， 也 就 是 两 个 或 更 多 个 对 象形 成 了 一 个 引用 环 ， 
这 会 导致 其 中 任何 一 个 对 象 的 引用 数 都 不 为 零 。 要 打破 这 个 循环 , 可 以 为 每 个 引用 环 链 接 使 用 一 
个 引用 对 象 。 这 个 技术 也 可 以 解决 “失效 侦 听 器 ”( lapsed listener ) 问题 。 





当 作 普通 MESIH 
对 象 处 理 。 对 象 处 理 


(b) 


图 12-5 在 一 次 回收 中 区 别 对 待 弱 引用 对 象 的 时 候 可 能 出 错 的 情况 : (a) 多 路 径 引 用 ; 
(b) 链 式 路 径 引用 
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既然 我 们 已 经 介绍 了 虚拟 机 ( VM ) 设计 中 的 重要 组 件 ， 现 在 是 时 候 简单 讨论 一 下 VM 实现 
的 架构 设计 了 。 


13.1 VM 组 件 


正如 第 10 章 中 已 经 讨论 过 的 ， 不 同 代 码 类 型 之 间 的 调用 关系 如 图 13-1 所 示 。 





Java 代 码 
lava eT 
本 地 让 
封装 etree 
:硬件 : 
: :错误 :， 
本 地 方法 本 地 EEH 
到 Java at 
桥接 plete tats 
函数 
VM 代码 


图 13-1 不 同类 型 代码 之 间 的 调用 关系 


图 13-1 中 ， 虚 线 框 是 应 用 程序 代码 ， 其 余 的 由 VM 实现 。 为 了 支持 所 有 Java 方 法 和 本 地 方 
TE, VM 需要 实现 下 列 组 件 。 注 意 这 个 列表 并 没有 包含 所 有 VM 组 件 ， 只 包含 了 主要 的 那些 。 

口 VM 核心 : 这 是 VM 实现 的 核心 ， 主 要 用 于 提供 类 支持 。 它 包含 乃 绕 着 类 的 所 有 核心 数 

据 结构 和 操作 逻辑 。 特 别 是 所 有 的 类 数据 都 有 详细 描述 ， 因 此 它们 可 以 被 反射 ， 包 括 

类 、 接 口 、 字 段 和 方法 。 这 对 于 VM 实现 虚拟 指令 集 架 构 CISA ) 的 语义 是 必要 的 ， 比 如 

动态 类 加 载 和 链接 。 类 支持 的 逻辑 主要 包括 类 加 载 、 链 接 、 初 始 化 和 反射 。VM 核心 包 
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fh VM 初始 化 和 关闭 ， 还 为 组 件 之 间 彼 此 交流 提供 了 接口 。 

O 本 地 支持 : 这 个 组 件 支 持 托管 代码 和 本 地 代码 之 间 的 本 地 接口 ， 包 括 依赖 于 VM 核心 的 
Java 本 地 接口 (JNI) 应 用 程序 接口 (API) o JNI API 需 要 访问 类 支持 用 于 反射 。 它 们 还 
需要 来 自 于 其 他 组 件 的 支持 ， 比 如 通过 VM 核心 接口 提供 的 异常 和 线程 。 

O 运行 时 辅助 : 这 个 组 件 向 Java 方法 提供 VM 服务 ,包括 通过 INI API 向 本 地 方法 提供 的 
同样 的 服务 。 由 于 两 个 世界 的 性 质 不 同 ， 同 一 个 VM 服务 对 Java 方法 和 本 地 方法 提供 的 
实现 可 能 有 所 不 同 。 异 常 抛 出 就 是 一 个 明显 的 例子 。 

口 内 核 类 : VM 需要 提供 某 些 需要 访问 VM 内 部 的 Java 类 的 实现 ，VM 内 部 对 于 VM 无 关 
的 普通 类 库 来 说 是 不 可 访问 的 。 内 核 类 的 一 些 例 子 包 括 反 射 、 引 用 对 象 、 线 程 、 对 象 和 
原子 。Java 反射 需要 访问 类 、 字 段 、 方 法 等 属性 ， 这 是 由 VM 核心 提供 的 。Java 引用 对 
象 必 须 是 VM 相关 的 ， 因 为 VM 需要 保持 Java 类 与 垃圾 回收 CGC ) 引用 对 象 处 理 之 间 的 
语义 一 致 性 ， 比 如 clear() 和 enqueue () 操 作 。Java 线程 需要 映射 到 操作 系统 (OS ) 的 
Ae ty, FEA, MARATE Java API 中 的 OS 功能 都 需要 由 VM 提供 ， 它 把 这 些 功能 
映射 到 OS 功能 。 

OC 异常 支持 : 这 个 组 件 为 本 地 方法 和 Java 方法 提供 异常 抛 出 支持 。 它 还 包括 硬件 错误 的 处 
理 逻 辑 

O 线程 支持 : 系统 需要 提供 能 够 填补 虚拟 ISA VM 和 底层 平台 之 间 的 语义 鸿沟 的 线程 支 
持 ， 包 括 线程 创建 、 调 度 和 同步 。 

O 执行 引擎: 这 是 执行 字 节 人 码 的 组 件 ， 包 括 即 时 (JIT ) 编译 器 和 /或 解释 器 。 有 可 能 存在 多 
A~ JIT 编译 吉 和 多 个 解释 需 。 它 们 可 以 通过 一 个 执行 驱动 ( 或 执行 管理 器 ) 管理 ， 这 样 在 
运行 时 可 以 为 不 同方 法 或 同一 方法 的 不 同 部 分 切换 执行 引 敬 (EE) o 

O 垃圾 回收 器 : GC 管理 对 象 分配 和 堆 使 用 ,包括 对 引用 对 象 和 终结 的 部 分 支持 。 可 能 存 
在 多 个 空间 回收 融 ， 由 同一 个 GC 管理 需 管 理 。 多 个 空间 回收 需 可 以 合作 回收 堆 上 不 同 
的 空间 ， 也 可 以 在 不 同 回 收 时 应 用 于 同一 个 空间 。 对 象 散 列 码 功能 通常 也 是 由 GC 组 件 
支持 的 。 


图 13-2 中 展示 了 前 面 介 绍 的 组 件 ， 其 中 保留 了 图 13-1 中 的 初始 结构 。 
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Java 代 码 


本 地 方法 =e. pn 








| 线程 
管理 器 


VM 代码 
图 13-2 VM 实现 中 的 主要 组 件 
从 虚拟 ISA VM 的 性 质 出 发 ， 很 容易 理解 为 什么 需要 这 些 组 件 。 


口 以 虚拟 ISA 指令 发 布 的 应 用 程序 是 不 可 执行 的 ， 需 要 在 VM 中 被 解释 或 编译 ， 因 此 需要 
“HITI” (EE) 

O 安全 性 要 求 应 用 程序 不 能 操作 内 存 ， 而 是 把 对 象 分 配 和 内 存 管 理 委托 给 “垃圾 回收 融 ”。 

O 为 了 执行 应 用 程序 ，VM 需要 调度 和 管理 执行 实体 。 在 VM 中 对 基于 控制 流 的 语言 来 
说 ， 执 行 实体 就 是 线程 ，VM 用 “线程 管理 器 ”来 管理 线程 。 

口 托管 代码 需要 访问 平台 资源 来 完成 有 意义 的 任务 ， 所 以 VM 需要 一 个 本 地 接口 来 提供 这 
种 访问 。“ 本 地 支持 ”提供 了 Java 世界 和 本 地 世界 之 间 的 接口 。 

O 对 提供 了 异常 抛 出 和 捕获 功能 的 语言 来 说 ，VM 需要 “异常 支持 ”来 实现 这 些 功能 。 异 
稼 支持 也 处 理 硬件 错误 和 OS 事件 /信号 。 

口 语言 依赖 于 VM 为 它 的 某 些 语义 提供 一 些 关键 运行 时 服务 ， 比 如 创建 对 象 和 抛 出 异常 。 
“运行 时 辅助 ”为 语言 提供 了 到 VM 服务 的 访问 。 

口 语言 库 的 核心 部 分 必须 依赖 于 VM 实现 ， 比 如 反射 和 栈 轨迹 的 相关 部 分 ， 因 此 需要 VM 
提供 的 “内 核 类 ”。 


在 所 有 这 些 主要 组 件 中 ，EE 是 唯一 不 向 托管 代码 提供 直接 服务 的 组 件 。 换 句 话 说 ,托管 代 


人 码 不 知道 EE 的 存在 。EE 总 是 隐 式 调用 的 。 


开发 虚拟 机 的 时 候 , 最 好 能 通过 常用 的 软件 工程 经 验 来 达到 软件 的 模块 化 和 可 移植 性 。 这 里 


模块 化 的 意思 是 ,组件 最 好 拥有 一 套 定义 良好 的 接口 , 彼此 之 间 不 要 过 度 耦 合 ， 这 样 不 同 组 件 的 
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开发 者 不 需要 维护 其 他 组 件 的 代码 或 者 交互 。 这 里 可 移植 性 的 意思 是 ，VM 应 该 试图 把 平台 相关 
的 部 分 抽象 到 其 他 组 件 下 面 的 一 层 , 这 样 多 数 工程 工作 就 不 需要 考虑 平台 相关 的 问题 , 因此 跨 平 
台 移 植 VM 变 得 很 容易 。 可 移植 性 是 一 个 传统 主题 , 已 经 有 大 量 相关 介绍 ,因此 我 们 只 关注 模块 
化 设计 主题 ， 并 以 Apache Harmony 为 例 。 


13.2 ”对 象 信息 暴露 


只 有 VM 核心 了 解 对 象 的 细节 。 一 个 对 象 的 几乎 所 有 信息 都 可 以 从 它 的 类 数据 结构 ( 假设 是 
vM_class ) 中 获得 。 在 这 种 意义 上 ， 其 他 组 件 可 以 拥有 一 个 指向 这 个 类 数据 结构 的 不 透明 指针 
(voidx ) 然后 向 VM 核心 查询 所 有 所 需 的 信息 。 例 如 ， 下 面 列举 了 一 些 VM 核心 接口 。 


口 bool class_has_finalizer(void* clss) 
如 果 这 个 类 有 非 默认 终结 器 方法 ， 返 回 TRUE, 
QO bool class_is_reference_type(void* clss) 
如 果 这 个 类 是 引用 对 象 类 型 ， 返 回 TRUE。 
QO bool class_is_array(void* clss) 
如 果 这 个 类 是 一 个 数组 ， 返 回 TRUE。 
QO bool class_has_reference_fields(void* clss) 
如 果 这 个 类 有 一 个 字段 是 对 象 引 用 ， 返 回 TRUE. 
QO unsigned int class_instance_size(void* clss) 
返回 给 定 类 的 一 个 实例 占用 的 内 存 大 小 。 
Q unsigned int array_get_length(void* arry) 
返回 这 个 数组 的 长 度 。 
QO void* array_get_element_addr(void* arry, unsigned int i) 
返回 数组 第 i 个 成 员 的 地 址 。 
这 个 不 透明 类 指针 必须 从 对 象 引用 可 以 访问 到 ， 这 样 给 定 对 象 引用 其 他 组 件 就 能 够 找到 它 。 
把 内 存 中 一 个 对 象 的 第 一 个 字段 作为 指向 它 的 类 数据 结构 的 不 透明 指针 是 很 方便 的 ， 如 下 所 示 。 
struct Object { 
void* clss; // 这 个 对 象 的 不 透明 类 指针 
_ // 这 个 对 象 的 其 他 字段 
VM 可 以 把 虚 方法 分 派 表 ( vtable ) 与 类 数据 结构 放 在 一 起 。VM 也 可 以 选择 把 它们 分 开放 置 。 
它们 是 1 : 1 映射 的 , 所 以 哪 种 方法 都 可 以 。 如 果 把 它们 分 开放 置 ，VM 就 可 以 把 所 有 vtable 都 放 
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在 一 段 统一 的 内 存 区域 中 ， 这 样 对 vtable 的 访问 可 以 具有 更 好 的 缓存 局 部 性 。 


在 Apache Harmony 中 ，vtable 和 类 数据 结构 是 分 开放 置 的 。 它 们 彼此 链接 ， 这样 VM 总 可 
以 从 一 个 找到 另 一 个 。 那 么 问题 就 是 ， 对 象 头 中 包括 的 不 透明 指针 应 该 指向 类 还 是 指向 vtable。 
从 性 能 的 角度 看 ,编译 后 的 Java 代码 在 运行 时 经 常 访问 一 个 对 象 的 实例 字段 , 并 访问 它 的 vtable 
用 于 虚 方 法 分 派 。Java 代码 访问 类 数据 结构 的 情况 是 不 常见 的 。 因 此 ， 对 象 头 中 保存 vtable 指针 
比较 合理 ， 如 下 所 示 。 


struct Object { 
void* vt; // 对 象 的 不 透明 vtable 指针 
Sek // 对 象 的 其 他 字段 


由 于 vtable 指针 和 类 指针 都 可 以 代表 对 象 的 类 型 ， 有 时 我 们 把 它们 都 称 作 “类 型 指针 ”。 


除了 每 个 对 象 中 存储 的 类 型 指针 ，VM 组 件 还 需要 另外 一 些 每 对 象 ( per-object ) 元 数据 。 例 
如 ， 线 程 管理 器 需要 用 于 monitor 实现 的 每 对 象 数据 ; GC 需要 用 于 回收 操作 的 每 对 象 数 据 ， 指 
一 个 对 象 是 已 被 标记 、 被 转移 还 是 脏 对 象 。 相 比 于 采用 独立 存储 ,这 些 对 象 元 数据 直接 编码 在 
对 象 内 部 会 更 方便 。Apache Harmony 为 它们 在 对 象 头 中 使 用 一 个 额外 的 指针 大 小 的 字段 。 这 样 
对 象 布局 就 变 成 了 如 下 所 示 。 
struct Object { 
void* vt; // 对 象 的 不 透明 vtable 指针 
Obj_info obj_info; // 重要 的 对 象 元 数据 


// 对 象 其 余 字 段 
} 


在 对 象 布局 上 VM 组 件 所 需 的 一 切 就 是 这 两 个 字段 了 。 对 除 VM 核心 之 外 的 其 他 组 件 不 需要 
定义 对 象 布局 细节 ( 即 实例 字段 )， 其 他 组 件 只 需要 了 解 对 象 头 定义 。 


struct Object_header { 
void* vt; // 对 象 的 不 透明 vtable 指针 
Obj_info obj_info; // 重要 的 对 象 元 数据 
} 


尽管 对 于 其 他 组 件 来 说 ， 有 了 对 象 头 就 足够 了 ， 但 这 并 不 是 性 能 最 优 的 。 举 例 来 说 ， 如 果 
GC 每 次 要 得 到 对 象 信息 时 ， 都 需要 调用 VM 核心 接口 方法 ， 那么 开销 会 非常 大 。 更 好 的 方法 是 
向 GC 暴露 一 些 重要 的 对 象 信息 ， 这 样 访问 它们 就 不 需要 经 过 接口 调用 。 下 面 列举 了 GC 最 常用 
的 对 象 信 息 。 
O 数组 标志 : 这 个 标志 指明 对 象 是 否 为 数组 。GC 扫描 对 象 获 得 引用 的 时 候 需 要 这 个 信 
息 。 访 问 数 组 元 素 的 方法 与 访问 对 象 字 段 的 方法 有 所 不 同 。 

O 终结 器 标志 : 这 个 标志 指明 对 象 是 否 有 一 个 非 默认 终结 器 。 如 果 有 的 话 ， 分 配 的 时 候 应 
该 把 它 添加 到 ao 中 。 

口 引用 对 象 标志 : A 如 果 是 的 话 ，GC 追踪 对 象 
rade 进行 特殊 处 理 。GC 还 需要 了 人 解 引用 对 象 内 部 所 指 对 象 字段 的 偏 移 
量 ， 这 样 才能 扫描 并 clear () 它 。 
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口 引用 字段 标志 : 这 个 标志 指明 对 象 是 否 有 任何 引用 字段 。GC 需要 这 个 信息 来 扫描 一 个 
对 象 ， 以 获得 它 的 可 达 对 象 。 
可 以 在 一 个 类 加 载 并 准备 好 的 时 候 ， 把 这 些 信息 提供 给 GC。 然 后 GC 可 以 把 这 些 信息 缓存 
到 一 个 它 无 须 询 问 YM 即 可 直接 访问 的 位 置 。 然 后 当 GC 执行 分 配 和 回收 的 时 候 , 它 就 可 以 快速 
获取 这 些 信息 。 对 于 非 性 能 关键 信息 ，GC 仍然 可 以 用 不 透明 类 指针 通过 询问 VM 核心 获得 。 
为 了 实现 这 种 数据 缓存 ， 我 们 向 YM 核心 提供 了 一 个 GC 接口: 
O void gc_class_prepared(void* clss) 


一 个 新 类 准备 好 之 后 ，VM 核心 调用 这 个 函数 。 在 这 个 函数 中 ，GC 向 VM 核心 查询 所 有 的 
性 能 关键 信息 ， 并 把 它们 缓存 在 本 地 。 


在 Apache Harmony 中 ,通过 gc_class_prepare() 获 得 的 信息 保存 在 一 个 数据 结构 cc_info 
中 ，vtable 头 中 的 指针 指向 这 个 数据 结构 ， 这 样 GC 就 可 以 很 容易 地 从 对 象 指针 获得 这 些 信息 ， 
如 下 所 示 。 


struct Vtable header { 
GC_info* gc_info; // 指向 GC 缓存 的 类 信息 的 指针 
} 


struct Object_header { 
Vtable_header* vt; // 对 象 的 不 透明 vtable 指针 
Obj_info obj_info; // 重要 的 每 对 象 元 数据 

$ 


GC_info* object_get_gcinfo(Object_header* obj) 
{ 
return obj->vt->gc_info; 


} 
接 下 来 的 几 节 会 介绍 如 何 设计 模块 化 GC 和 JIT 组 件 。 


13.3 垃圾 回收 器 接口 


可 以 把 GC 组 件 构造 为 有 良好 定义 接口 的 动态 链接 库 。 为 了 使 VM 在 GC 上 调用 而 不 牺牲 功 
能 性 、 灵 活性 和 性 能 ， 只 有 少数 几 个 接口 是 至 关 重 要 的 。 前 面 提 到 的 gc_class_prepared() 
就 是 其 中 之 一 ， 它 对 性 能 十 分 重要 。 

线程 相关 API: 下 面 的 接口 文 持 修 改 需 与 回收 器 之 间 的 交互 。 

O void ge matater init t) 


修改 器 被 创建 时 调用 这 个 API 它 初始 化 这 个 修改 器 分 配器 和 GC 中 其 他 修改 器 专用 数据 
结构 ， 包 括 这 个 修改 带 被 链 入 的 列表 。 


OU void gc_mutator_destruct () 


修改 器 退出 的 时 候 调 用 的 API。 它 清理 修改 器 专用 数据 结构 。 
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分 配 API: GC 需要 为 Java 代码 和 本 地 方法 提供 一 个 接口 来 分 配对 象 。 
QO Object_header* gc_mutator_alloc(unsigned size, Vtable_header* vt) 


这 个 API 用 于 分 配 一 个 总 大 小 为 size 字 节 的 对 象 。 给 出 这 个 对 象 的 vtable 指针 vt 用 来 
指定 这 个 对 象 的 类 型 。GC 需要 类 型 信息 来 确定 这 个 对 象 是 否 有 非 默 认 终结 器 ,是 否 为 引 
用 对 象 类 型 ， 等 等 。 这 个 函数 可 能 触发 回收 ， 所 以 调用 它 的 代码 必须 是 一 个 安全 点 或 者 
在 安全 区 域内 。 


D Object_header* gc_mutator_alloc_fast (unsigned size, Vtable_header* vt) 


这 个 API 用 于 分 配 一 个 总 大 小 为 size 字 节 的 对 象 。 给 出 这 个 对 象 的 vtable 指针 vt 用 来 
指定 这 个 对 象 的 类 型 。 这 是 gc_mutator_alloc() 的 快速 路 径 ， 只 用 于 不 触发 回收 的 常 
用 分 配 情况 。 如 果 有 触发 回收 的 风险 ， 这 个 API 就 返回 NULL. 
在 用 于 对 象 分 配 的 运行 时 辅助 中 ， 代 码 首先 调用 gc_mutator_ alloc_fast(). WR 
它 返回 NULL ,那么 代码 就 在 栈 上 准备 M2N _wrapper, 然 后 调用 gc_mutator_alloc()。 
gc_mutator_alloc_fast() 的 目的 是 避免 代价 高 昂 的 M2N_wrapper 的 准备 和 清理 ,这 
个 API 只 是 用 于 提高 性 能 ， 所 以 是 可 选 的 。 

读 / 写 屏 障 API: GC 需要 提供 接口 来 支持 读 / 写 屏障 。 

O Barrier_Type gc_requires_barriers () 


这 个 API 用 来 指示 GC 是 否 需 要 VM (包括 JIT 编译 器 和 解释 器 ) 来 插入 读 / 写 屏障 。 它 返 
回 要 插入 的 屏障 类 型 。 


Dvoid gc heap write (Object_header* dst, Object_header** dst_slot, 
Object_header* src, Op_Type op) 


当 对 象 引 用 src 要 被 写 入 堆 中 地 址 为 dst_slot 的 对 象 dst 时 调用 的 API。 这 个 API 
含 了 单个 对 象 字 段 存 储 、 数 组 复制 和 对 象 克隆 的 情况 。 它 用 op 告知 GC 是 哪 种 写 情况 。 
这 个 API 内 也 执行 了 堆 写 操作 本 身 , 因为 GC 可 能 需要 在 写 之 前 、 写 之 后 , 或 者 在 多 次 写 
的 当中 加 入 屏障 ， 例 如 在 数组 复制 中 。 所 以 这 个 API 是 堆 写 操作 和 写 屏 障 的 合并 。 这 个 
API 可 以 分 割 为 几 个 独立 的 API， 用 于 不 同 操作 。 


ü Object_Header* gc_heap_read_barrier (Object_header* src, Object_header** 
gre glot) 
当 对 象 src 或 对 象 src 的 引用 字段 src_slot 要 被 读 取 的 时 候 调 用 的 API。 它 返回 用 于 
对 象 访问 的 正确 引用 。 这 个 读 屏障 用 于 目标 空间 不 变 的 并 发 复制 回收 。 它 并 不 执行 实际 
的 对 象 读 取 操作 ,而 是 返回 用 于 对 象 读 取 的 正确 引用 ,在 任何 对 象 访问 之 前 调用 这 个 API。 
注意 这 里 的 读 / 写 屏障 接口 只 是 示例 。 实 际 VM 实现 可 能 选择 不 同 的 设计 。 
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编程 API: 需要 下 列 接口 来 实现 Java 编程 APIT。 

O void geforce ge () > 
VM 用 这 个 API 强制 发 起 一 次 GC， 通 常 是 响应 对 java.lang.Runtime. gc 的 调用 。 

O long int ge total memory () 
VM 用 这 个 API 确定 当前 的 GC 堆 大 小 ， 通 常 是 响应 对 java. 1ang.Runtime.totalMemory 
的 调用 。 返 回 值 是 “long int” 类 型 ,表明 它 必须 与 平台 指针 具有 同样 的 整数 大 小 。 

QO long int gc_max_memory () 
VM 用 这 个 API 确定 最 大 GC 堆 大 小 ， 通 常 是 响应 对 java.1lang.Runtime .maxMemory 
的 调用 。 

QO long int gc_free_memory () 


VM 用 这 个 API 获 得 空闲 空间 的 大 概 容量 ， 通 常 是 响应 对 java. lang.Runtime. freeMemory 
的 调用 。 

QO int gc_get_hashcode (Object_header* obj) 
VM 用 这 个 API 获得 对 象 的 散 列 值 ， 通 常 是 响应 对 java.lang.Object .hashGode 的 
调用 . 

DQ bool gc_is_object_pinned (Object_header* obj) 
VM 用 这 个 API 来 确定 目标 对 象 是 否 为 不 可 移动 的 。JNI ph GetxxxArrayElements 
中 可 以 选用 这 个 API， 其 中 XXX 表示 一 个 基本 类 型 。 

GC 生命 周期 API: VM 初始 化 和 关闭 GC 组 件 。 

O void ge_inié () 

O void gc_destruct () 
VM 用 于 初始 化 和 关闭 GC 组 件 的 API。 

根 集 枚 举 API: GC VM 提供 一 个 API， 用 于 添加 根 集 条 目 。 

Q void gc_add_rootset_entry (Object_Header** p_ref) 


VM 使 用 这 个 API 添 加 一 个 根 集 条 目 。 这 是 GC 请 求 VM 核心 枚 举 一 个 根 集 时 的 一 个 回调 。 
VM 暂停 修改 器 线程 来 枚 举 根 集 ， 然 后 通过 调用 这 个 API 向 GC 报告 每 个 根 集 条 目 。 


GC 组 件 需 要 访问 许多 VM 核心 API， 它 们 可 以 分 为 两 类 。 一 类 是 用 于 一 般 类 信息 查询 。 男 
一 类 是 用 于 根 集 枚 举 。 把 根 集 枚 举 的 核心 函数 放 在 VM 核心 中 是 合理 的 , 因为 这 个 过 程 需要 与 垃 
圾 回收 、EE、 线程 支持 和 本 地 支持 这 样 的 其 他 组 件 交 互 。VM 核心 提供 的 根 集 枚 举 相 关 API 列举 
如 下 。 
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QO void vm_suspend_thread (VM_thread* mutator) 


Q void vm_resume_thread (VM_thread* mutator) 
GC 调用 这 个 方法 请 求 VM 暂停 /恢复 某 个 线程 。 
口 void vm_enumerate_thread_rootset (VM_thread* mutator) 
GC 调用 这 个 函数 让 VM 枚 举 一 个 线程 ,这 个 线程 是 使 用 vm_suspend_thread() 暂 停 的 。 
Q void vm_enumerate_global_rootset () 
GC 调用 这 个 函数 让 VM 枚 举 全 局 根 集 。 
注意 对 GC 安全 点 和 安全 区 域 的 支持 不 是 由 GC 组 件 实现 的 , 而 是 由 线程 管理 融 实 现 的 。GC 
通过 VM 核心 与 之 交互 。 


这 里 给 出 的 GC 接口 是 用 于 单个 GC 组 件 的 〈 即 一 个 动态 链接 库 )。 一 个 VM 实现 可 能 具有 
多 个 GC 实现 ， 每 个 实现 放 在 一 个 GC 组 件 中 。 在 VM 执行 的 一 个 实例 中 ， 只 能 加 载 一 个 GC 组 
件 。 这 并 没有 限制 GC 实现 的 灵活 性 ， 因 为 一 个 GC 组件 可 以 实现 多 个 回收 算法 。 这 种 情况 下 ， 
多 个 算法 彼此 之 间 如 何 合作 完全 是 GC 组 件 的 内 部 实现 ， 因 为 GC 组件 通过 前 面 介绍 的 一 组 接口 
支持 VM。 这 种 设计 选择 已 经 被 证 明 是 强 有 力 的 ， 因 为 不 同 的 GC 开发 者 可 以 轻松 地 开发 他 们 自 
己 的 独立 GC 组件 。 同 时 ,他 们 又 具有 是 够 的 灵活 性 ， 在 自己 的 GC 组 件 中 容纳 任何 回收 算法 。 


13.4 执行 引擎 接口 


执行 引擎 (EE) 大 体 上 是 隐藏 在 其 他 VM 组 件 之 后 的 。 它 可 能 频繁 访问 其 他 组 件 ， 但 很 少 
被 其 他 组 件 访问 。 主 要 原因 在 于 ，EE 概念 上 与 托管 代码 一 起 使 用 来 自 VM 的 服务 ， 而 不 是 被 来 
自 VM 的 服务 所 使 用 。 从 应 用 程序 的 角度 来 看 ， 没 有 依赖 于 EE 的 Java 编程 API。 


一 个 VM 中 可 能 实现 了 多 个 JIT 编译 器 。 它 们 都 可 以 被 封装 在 同一 个 EE 中 。 就 像 GC 一 样 ， 
可 以 开发 多 个 EE 组件, 但 VM 的 一 个 实例 只 会 加 载 其 中 一 个 。 


下 面 是 EE 暴露 的 主要 接口 。 
EE 生命 周期 API: VM 初始 化 和 关闭 EE 组 件 。 


D void ee_init() 


ū void ee_destruct () 
VM 用 来 初始 化 和 关闭 EE 组 件 的 API. 
执行 API: 这 是 EE 存在 的 唯一 目的 。 
QO void ee_invoke_method(Method* method) 


用 来 调用 一 个 方法 的 API， 这 个 方法 可 以 是 Java 方法 或 本 地 方法 ， 假 定 要 传递 给 目标 方 
法 的 参数 已 经 在 栈 上 备 好 。 如 果 是 第 一 次 调用 一 个 虚 方 法 ，JIT 编译 融会 在 这 个 方法 的 声 
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明 类 的 vtable 中 安装 “编译 后 方法 代码 ”入 口 地 址 。 如 果 目 标 是 一 个 本 地 方法 ， 这 个 API 
需要 调用 VM 核心 来 准备 Java 到 本 地 封装 代码 作为 “编译 后 方法 代码 ”。 在 目标 方法 第 一 
次 被 调用 之 前 ，vtable 条 目 就 是 一 个 指针 ， 指 向 一 段 通过 运行 时 辅助 调用 这 个 API 的 桩 
(stub) 代码 。 不 管 是 Java 方法 还 是 本 地 方法 ， 传 给 目标 方法 的 参数 由 调用 方 方 法 准备 。 
这 个 API 不 是 必须 骏 露 的 。 

栈 API: 只 有 EE 知晓 编译 后 代码 的 栈 布 局 。 这 些 API 对 于 栈 轨 迹 准 备 、 异 常 抛 出 和 根 集 枚 

举 是 必要 的 。 

DQ Code_info ee_get_code_info(void* ip) 
VM 用 来 获得 程序 指针 ip 指向 的 代码 信息 的 API。 这 些 信息 包括 : 代码 是 编译 后 的 Java 
代码 还 是 本 地 代码 ; 所 属 的 方法 ; 如 果 是 编译 后 的 Java 代码 ， 它 相应 的 字 节 码 信息 是 什 
a, GH. 

O void ee_unwind_stack_frame(Frame_context* frame) 


VM 用 来 展开 栈 上 一 个 帧 的 API 


Oh Exc_Handler* ee_find_match_exception_handler(Frame_context* frame, 





jobject Exception_obj) 
VM 用 来 在 Java 方法 中 寻找 匹配 异常 处 理 带 的 API。 这 个 API 也 会 修改 帧 内 容 ， 使 得 它 
可 以 表示 捕获 异常 处 理 右 的 上 下 文 。 调 用 这 个 API 之 后 ,根据 保存 在 帧 上 下 文中 的 信息 ， 
控制 可 以 转移 到 异常 处 理 需 。 


口 void ee_enumerate_rootset (Frame_context* frame) 

VM 用 来 在 当前 栈 帧 上 枚 举 根 集 条 目的 API。 它 调用 VM 接口 向 GC 报告 这 些 条 目 。 
可 以 看 到 ，EE API 多 数 都 与 运行 时 栈 处 理 相 关 。 这 可 能 是 VM 需要 EE 帮助 的 唯一 方面 。 
以 上 只 给 出 了 模块 化 设计 的 两 个 示例 。 其 他 组 件 也 可 以 遵循 这 个 原则 设计 自己 的 接口 。 


13.5” 跨 组 件 优 化 


严格 的 模块 化 设计 可 能 会 限制 某 些 需 要 组 件 间 额 外 约定 的 优化 。 比 如 ， 如 果 JIT 编译 器 了 解 
如 何 从 一 个 类 的 vM_class 数据 结构 找到 它 的 java.1lang .class WH, 这 个 JIT 就 不 需要 生成 
运行 时 辅助 来 调用 VM 核心 得 到 这 个 服务 。 这 个 JIT 可 以 直接 生成 这 段 代码 序 列 。 原 来 的 代码 序 
列 如 下 : 


push pointer_to_vmclass 
call runtime_get_j1C_from_vmclass 


指向 一 个 类 的 java.lang.class 对 象 的 指针 保存 在 它 的 VM_class 数据 结构 中 。 假 定 JIT 
编译 器 知道 这 个 指针 保存 在 vM_class 中 的 偏 移 量 ， 那 么 新 代码 序列 看 起 来 就 是 这 样 : 
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mov pointer_to_vmclass -> eax 
mov [eax + jlC_offset] -> eax 


这 里 常量 j1c_offset 是 指向 一 个 类 的 java.lang.class 对 象 的 指针 保存 在 VM_class 
中 的 偏 移 量 ， 新 代码 序列 可 以 节省 一 次 函数 调用 。 


实现 这 个 优化 有 几 种 方法 。 一 种 方法 是 ， 当 类 加 载 和 准备 的 时 候 ，JIT 编译 器 在 jit_class_ 
prepared () 内 缓存 j1c_offset {H, 类 似 于 gc_class_prepared() 为 GC 组 件 所 做 的 。 这 个 
解决 方案 的 局 限 性 是 , 它 实际 上 不 仅 需要 向 JIT 暴露 偏 移 量 信息 ,而且 还 需要 vM_class 数据 结 
构 中 指向 java.lang.Class 对 象 的 指针 放 在 固定 的 偏 移 位 置 上 。 


另 一 种 方法 是 VM 核心 用 专门 编写 的 汇编 版 本 提供 这 个 函数 ， 这 样 函 数 调用 的 负担 会 尽 可 
能 小 。 


还 有 一 种 优化 方法 是 允许 JIT 编译 器 内 联 对 运行 时 辅助 或 VM 服务 的 调用 ,以 此 来 节省 调用 
开销 ， 就 像 第 10 章 中 提 到 的 。 这 可 以 通过 引入 额外 的 编译 器 基础 设施 来 实现 : 它 支 持 运行 时 畏 
助 被 编写 和 编译 为 与 IT 所 使 用 的 相同 的 中 间 表 示 CIR). 


举例 来 说 ，gc_mutator_alloc_fast () 接 口 是 最 常用 的 用 于 对 象 分 配 的 GC API。 如 果 快 
速 路 径 不 适用 于 所 需 分 配 的 话 ， 它 就 会 返回 NULL。 常 见 的 代码 如 下 (使 用 跳 增 指针 分 配 胡 ): 


Object_header* gc_mutator_alloc_fast (int obj_size, 
Vtable_Header* vt) 
{ 
// 这 个 类 有 终结 器 ， 留 给 慢 速 路 径 gc_mutator_alloc 
if( vt_has finalizer (vt)) 
return NULL; 


// 对 象 太 大 ， 留 给 慢 速 路径 
if ( obj_size > GC_LARGE_OBJ_SIZE_THRESHOLD ) 
return NULL; 


// 得 到 修改 器 的 线程 局 部 分 配器 

Allocator* allocator = (Allocator*)gc_get_mutator_allocator(); 
long free = allocator->free; 

long ceiling = allocator->ceiling; 

long new_free = free + obj_size; 


// 如 果 有 足够 空 亲 空间， 进行 分 配 

if (new_free <= ceiling) { 
allocator->free= new_free; 
obj_set_vt ((Object_Header*) free, vt); 
return (Object_Header*) free; 

} 


// 没有 足够 空 闸 空间 ， 留 给 慢 速 路 径 gc_mutator_alloc 
return NULL; 
} 


这 个 函数 可 以 用 “ 非 安全 Java” XM, HP JIT 编译 器 会 把 像 Address 这 样 的 特殊 类 看 作 内 
在 服务 ， 并 把 它们 编译 为 内 存 地 址 操作 。 既 然 这 个 函数 和 应 用 程序 代码 一 样 是 由 JIT 编译 器 编译 
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的 ， 它 可 以 被 内 联 ， 并 可 以 使 用 更 多 优化 。 
“SEXS Java” 版 的 gc_mutator_alloc_fast () 像 如 以 下 代码 所 示 。 这 里 Gc_Helper 是 
一 个 Java 类 ， 包 含 所 有 以 “ 非 安 全 Java ”编写 的 GC 服务 。 


private static Address mutator_alloc_fast(int objSize, Address vt) 
{ 
if ( GC_Helper.VT_has_finalizer (vt) ) 
return null; 


if( objSize > GC_Helper.GC_LARGE_OBJ_SIZE_THRESHOLD ) 
return null; 





Address allocator = GC_Helper.get_mutator_allocator(); 
Address free_addr = allocator.plus(FREE_OFFSET) ; 
Address free = free_addr.loadAddress(); 

Address ceiling_addr = allocator.plus (CEILING_OFFSET) ; 
Address ceiling = ceiling_addr.loadAddress(); 

Address new_free = free.plus(obiSize) ; 


if (new_free.LE(ceiling)) { 
free_addr.store(new_free) ; 
GC_helper.obj_set_vt (free, vt); 
return free; 


} 


return null; 


} 

PASE IR, BAERE RD KA. Te i TB) “ARE 4 Java” 
版 本 是 繁复 艰难 的 工作 。 有 一 些 研究 试 网 把 C/C++ 代码 和 Java 代码 编译 为 同样 的 了 及， 这 样 用 本 
地 代码 编写 的 运行 时 辅助 也 可 以 内 联 到 编译 后 的 Java 代码 中 ,但 它 需 要 以 源码 或 IR 的 形式 部 署 
这 些 组 件 。 


大 后 | 二 
第 四 部 分 
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我 们 已 经 理解 了 虚拟 机 ( VM ) 实现 中 所 有 的 重要 组 件 ， 现 在 可 以 讨论 的 不 止 是 功能 ， 也 可 
以 讨论 优化 了 。 在 VM 开 发 中 , 基本 功能 的 实现 相对 轻松 ， 主 要 精力 通常 用 在 优化 VM 以 得 到 更 
好 的 性 能 上 , 包括 吞吐 量 、 可 扩展 性 和 响应 性 。 本 章 将 介绍 各 种 VM 组 件 优 化 技术 ， 先 从 垃圾 回 
收 开 始 。 


第 $ 章 中 已 经 介绍 了 常用 的 垃圾 回收 ( GC ) 设计 。VM 中 使 用 的 算法 通常 包括 引用 计数 
(reference-count )、 标 记 清 除 ( mark-sweep )、 半 空间 ( semi-space )、 追 踪 转 发 〈trace-forward ) 和 
标记 压缩 (mark-compact )。 第 13 章 中 提 到 ， 一 个 VM 实现 可 以 有 多 个 GC 组件 , 但 一 个 VM 运 
行 实例 只 能 加 载 一 个 GC 组件， 一 个 组 件 可 以 带 有 多 个 GC 算法 。 一 个 组 件 中 拥有 多 个 GC 算法 
的 好 处 是 提供 了 一 种 灵活 性 ， 在 不 同情 况 下 可 以 采用 不 同 的 算法 。 

重要 的 一 点 是 ，GC 性 能 主要 是 由 应 用 程序 特性 决定 的 。 本 章 讨论 的 各 种 技术 不 是 所 有 应 用 
程序 都 适用 的 。 这 些 技术 只 是 在 优化 方法 论 方面 给 VM 开发 者 一 点 提示 。 
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一 轮 垃圾 回收 可 以 回收 整个 堆 ， 也 可 以 只 回收 堆 的 一 部 分 。 全 堆 回 收 通常 是 就 地 回收 ， 也 就 
是 说 ， 它 不 需要 回收 之 前 堆 中 有 任何 空 闪 空间 (或 者 只 要 求 留 有 很 小 的 空 闪 空间 )， 因 此 当 VM 
想 要 完整 利用 堆 空 间 的 时 候 , 就 需要 这 种 算法 。 常 用 的 就 地 回收 算法 有 引用 计数 、 标 记 清 除 和 标 
记 压 缩 。 


通过 只 在 某 个 特定 的 部 分 回收 区 域 应 用 就 地 全 堆 回 收 算法 , 可 以 实现 部 分 堆 回 收 。 如 果 其 他 
区 域 有 空闲 空间 可 用 , 部 分 堆 回收 也 可 以 把 被 回收 区 域内 的 留存 活跃 对 象 移动 到 空闲 空间 中 , 也 
就 是 复制 式 回收 ， 这 就 是 非 就 地 回收 算法 了 。 典 型 的 复制 式 回收 算法 包括 半空 间 、 追 踪 转 发 和 标 
记 复 制 。 

就 地 回收 与 非 就 地 回收 之 间 没 有 严格 的 界限 。 在 一 次 就 地 回收 中 , 保留 的 空闲 空间 可 以 小 到 
只 有 单个 种 子 页 面 ， 回 收 把 活跃 对 象 移动 到 空闲 空间 ,这样 就 清空 了 一 些 已 使 用 页 面 , 可 供 下 一 
轮 活跃 对 象 移动 使 用 。 在 这 个 设计 中 ， 非 就 地 回收 达到 了 “就 地 ”的 效果 。 
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就 地 全 堆 回 收 需 要 处 理 所 有 的 堆 对 象 ， 有 各 种 缺点 例如， 标记 压缩 算法 需要 整个 堆 上 的 多 
趟 操作 。 常 用 的 滑动 压缩 算法 有 4 趟 操作 : 
void mark_compact () 
{ 
passl: 
traverse_object_graph(); 
pass2: 
compute_new_locations(); 
pass3: 
repoint_object_references(); 
pass4: 
compact_space(); 
} 


这 4 趟 中 的 每 一 趟 都 需要 遍历 整个 堆 ， 这 带 来 了 很 大 的 内 存 访问 开销 。 这 也 使 得 这 个 算法 的 
并 行 化 效率 不 高 ,因为 需要 所 有 回收 需 在 每 一 趟 起 点 处 同步 。 注意, 可 以 通过 精巧 设计 和 辅助 数 
据 结构 支持 把 多 趟 压缩 优化 为 更 少 的 趟 次 ， 稍 后 会 介绍 。 

标记 清除 算法 只 有 两 趟 , 但 是 它 不 能 解决 堆 碎 片 问题 , 所 以 实际 上 在 商业 VM 实现 中 没有 把 
它 用 作 主 要 算法 ， 除 非 是 用 于 大 对 象 空间 (large object space, LOS ) GC 或 者 并 发 GC 这 样 的 特 
殊 情 况 。 

除了 多 趟 次 这 个 缺点 ， 全 堆 算 法 也 无 法 从 下 面 这 个 事实 中 受益 。 多 数 应 用 程序 中 ,新 分 配 的 
对 象 可 能 更 早死 去 ， 而 活 下 来 的 对 象 可 能 活 得 更 久 。 全 堆 算 法 以 同样 的 方式 处 理 新 旧 对 象 ， 而 大 
多 数 旧 对 象 可 能 会 继续 存活 ， 所 以 对 回收 而 言 ， 处 理 旧 对 象 比 处 理 新 对 象 得 到 的 好 处 要 少 得 多 。 
这 是 分 代 式 GC 的 基本 假设 ， 其 通常 只 处 理 新 对 象 。 


部 分 堆 回收 可 以 选择 活跃 对 象 最 少 的 堆 区 域 来 回收 。 这 样 一 来 ,回收 时 间 就 会 短 很 多 。 尽 管 
部 分 堆 回 收 有 它 的 优点 , 但 它 只 回收 整个 堆 中 死亡 对 象 的 一 部 分 ， 所 以 它 的 优点 也 是 有 限 的 。 同 
时 ,不管 是 部 分 堆 回 收 还 是 全 堆 回 收 ， 回 收 都 会 引发 类 似 的 暂停 线程 、 枚 举 根 集 等 操作 。 如 果 这 
个 开销 太 大 , 在 这 些 支 持 性 操作 上 花费 的 时 间 可 能 在 一 次 回收 中 占 主要 部 分 , 这 就 抵消 了 部 分 堆 
回收 的 优点 。 那么 问题 是 ， 如 何 比 较 部 分 堆 回 收回 收 和 全 堆 回 收 的 回收 效率 ,以 及 何 时 是 回收 部 
分 堆 或 完整 堆 的 好 时 机 。 

在 常用 的 GC 设计 中 ,为 了 获得 部 分 堆 回收 的 益处 ， 堆 通常 被 分 割 为 多 个 空间 。 引 入 新 对 象 
空间 ( new object space, NOS ) 用 于 新 对 象 分 配 。 当 它 满 了 的 时 候 ， 就 在 其 上 执行 一 次 部 分 堆 回 
收 。 存活 的 对 象 被 移动 到 成 熟 对 象 空间 (mature object space, MOS )， 这 样 NOS 就 被 再 次 清空 用 
于 新 对 象 分 配 。 图 14-1 中 给 出 了 这 个 堆 布 局 。 
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图 14-1 常用 GC 设计 的 堆 布 局 





对 不 同 的 空间 应 用 不 同 的 回收 算法 。 


O NOS 通常 使 用 复制 式 GC， 把 存活 对 象 移动 到 MOS。 

O MOS 通常 使 用 就 地 移动 式 GC， 比 如 标记 压缩 算法 ， 把 活跃 对 象 压 缩 到 空间 一 端 

分 配 只 发 生 在 NOS 中 。 

为 了 改善 NOS-MOS 管理 , 并 避免 从 NOS 到 MOS 移动 大 活跃 对 象 , 有 时 会 引入 第 三 个 空间 
LOS， 用 来 分 配 大 于 某 个 靖 值 的 对 象 。LOS 通常 使 用 非 移 动 式 GC 来 避免 移动 大 型 对 象 ， 比 如 使 
用 标记 清除 算法 。 为 了 简洁 性 ， 这 一 节 里 没有 把 LOS 纳入 讨论 ， 但 这 不 会 影响 结论 。 有 时 候 ， 
在 NOS 和 MOS 之 间 还 可 能 有 一 个 青年 对 象 空间 (young object space, YOS )， 这 样 NOS 对 象 首 
先 被 升级 到 YOS， 当 YOS 满 7 之 后 ， 它 的 对 象 会 被 升级 到 MOS。 后 面 将 对 此 做 进一步 讨论 。 


NOS 大 小 可 以 是 固定 的 也 可 以 是 可 变 的 。 如 果 是 固定 的 ，NOS 就 无 法 充分 利用 空闲 空间 用 
于 分 配 ， 即 使 是 在 起 初 堆 空间 大 部 分 都 为 空 的 情况 下 。 正 确 选 择 NOS 大 小 也 是 一 个 问题 。 固 定 
的 NOS 大 小 有 时 候 用 于 两 代 的 分 代 式 GC。 这 里 我 们 使 用 一 个 更 好 的 方法 ,就 是 允许 NOS 使 用 
堆 中 尽 可 能 多 的 可 用 空闲 空间 进行 对 象 分 配 , 只 要 MOS 有 足够 的 保留 空闲 空间 容纳 NOS ibid 
活 对 象 即 可 。 后 面 还 会 讨论 空间 大 小 调整 算法 。 本 节 讨 论 GC 如 何 决定 在 一 次 回收 中 回收 哪个 
间 (NOS 或 MOS )。 


在 次 回收 中 ， 只 回收 NOS。 在 主 回收 中 ， 回 收 所 有 的 空间 。 次 回收 是 部 分 堆 回收 ， 主 回收 
是 全 堆 回 收 。 CE a MOS 保留 空闲 区 域 。 在 第 一 次 回收 中 ,只 有 NOS 中 有 对 
象 。MOS 是 空 只 保留 以 待 NOS 回收 。 


随 着 几 轮 次 回收 过 后 , 堆 中 的 全 部 空闲 空间 变 得 越 来 越 少 。 这 意味 着 不 得 不 更 频繁 地 触发 次 
回收 。 最后， 当 NOS 空间 太 小 时 ， 就 会 触发 一 次 主 回 收 。 主 回收 回收 MOS 中 的 死亡 对 象 ， 就 释 
放 了 MOS 中 的 一 些 空间 。 之 后 的 回收 可 以 再 次 执行 次 回收 。 

问题 是 , 分 配 空间 (NOS ) 要 触发 一 次 主 回收 ， 判 断 它 太 小 的 标准 是 什么 。 一 个 直观 的 设计 
是 采用 一 个 固定 的 最 小 值 ， 比 如 4MB 或 者 16MB。 但 这 不 一 定 就 是 一 个 好 设计 。 


这 里 讨论 为 外 一 种 已 经 被 证 明 有 效 的 自 适应 策略 。 这 个 自 适 应 策略 的 目标 是 找到 最 优 的 最 小 
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空闲 空间 来 触发 主 回收 ， 以 获得 最 大 整体 回收 吞吐 量 ( collection throughput )。 


GC 算法 对 一 个 应 用 程序 的 回收 吞吐 量 ， 是 用 一 次 应 用 程序 执行 中 所 有 回收 产生 的 所 有 空闲 
区 域 大 小 总 和 与 所 有 回收 时 间 总 和 的 比值 衡量 的 ， 公 式 如 下 : 

Throughput = (3 Size_of_freed_space) / (2 Time_of_collection) 

假设 一 次 主 回收 之 后 ， 全 扒 空 闲 空间 大 小 是 Fmax， 触 发 一 次 主 回 收 的 全 堆 空 闲 空间 大 小 国 
值 是 Fmin。 如果 Fmin 接近 于 0, 那 就 意味 着 只 有 当空 闲 空间 不 足以 持 有 次 回收 存活 者 的 时 候 才 
触发 一 次 主 回 收 。 如 果 Fmin 接近 于 Fmax， 那 么 GC 总 是 使 用 主 回收 。 这 个 自 适应 式 设 计 的 目 
标 就 是 找到 可 以 获得 最 大 GC 吞吐 量 的 正确 Fmin。 

我 们 把 一 次 回收 超级 周期 定义 为 从 一 次 主 回收 完成 时 间 点 到 下 一 次 主 回收 完成 时 间 点 之 间 
的 时 间 段 。 超 级 周期 内 的 回收 包括 第 二 次 主 回收 和 这 两 次 主 回 收 之 间 的 所 有 次 回收 。 如 果 一 个 策 
略 可 以 得 到 一 个 超级 周期 内 的 最 大 回收 吞吐 量 , 那么 这 个 应 用 程序 可 以 通过 这 个 策略 得 到 整体 最 
大 回收 吞吐 量 。 所 以 我 们 把 关注 点 只 放 在 一 次 超级 周期 的 吞吐 量 上 。 

假定 在 每 次 次 回收 之 后 ，NOS 中 存活 对 象 的 大 小 总 和 是 as， 那么 比 起 上 一 次 次 回收 之 后 的 
空闲 空间 大 小 ， 堆 中 空闲 空间 大 小 减少 了 as。 这 意味 着 ， 在 一 次 主 回收 之 后 ， 下 一 次 主 回收 之 
前 可 以 执行 的 连续 次 回收 的 次 数 为 (Fmax - Fmin) /as。 之 后 堆 中 空闲 空间 大 小 变 为 fmin， 需 
要 执行 一 次 主 回收 。 

如 果 每 次 次 回收 需要 的 时 间 是 Tminor， 主 回收 需要 的 时 间 是 Tmajor， 在 一 次 超级 周期 中 
所 有 回收 花费 的 全 部 时 间 为 


Toate = (Pmax = Fmin)/dS) * Iminor + Tmajor 

这 个 过 程 中 产生 的 全 部 空闲 区 域 大 小 为 

Pe cycle = 
Fmax - dS + // 第 一 次 次 回收 之 后 
Fmax — 2*dS + // 第 二 次 次 回收 之 后 
sen T 
Fmax - (n-1)*dS + // 第 (n-1) 次 次 回收 之 后 
Fmin + // 第 n 次 次 回收 之 后 
Fmax // 一 决 主 回 妆 之 后 

加 起 来 是 

Faeces = (FMax + Fmin)*(Fmax = Fmin + dS) /(2*ds) 

ARA — Voc Ve HSC Es AG SEAE ak aE 
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Fmax, dS, Tminor 和 Tmajor 可 以 在 运行 时 测量 ， 表 示 为 a、b、c、da， 上 面 公式 就 变 为 
一 个 Fmin AY PRR: 
TP(X)= ((((a-X)/b)*c+d)/((a+X)*(a-X+b)/(2*b)), 其 中 XxX = Fmin 


可 以 通过 求解 微分 方程 得 到 TP (x) 最 大 值 , X 的 解 就 是 Fmin。 在 每 次 回收 结尾 计算 出 Fmin 
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值 。 如 果 一 次 次 回收 之 后 剩余 的 空闲 区 域 大 小 不 超过 Fmin， 下 一 次 回收 就 应 该 执行 主 回 收 。 
通过 著名 Java 基准 测试 SPECJBB 得 到 ， 当 Fmin 为 固定 值 16MB 的 时 候 ， 这 个 直观 设计 的 
吞吐 量 曲 线 如 图 14-2 所 示 。 主 回收 值 用 “M” 表 示 ， 次 回收 值 用 “m” 表 示 。 
吞吐 量 


imi E P imi 
m: ;im，， 整 体 否 吐 量 


Py ns ee en ee Otis dere ees kes ete Be E ele ew ie ae oe 
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时 间 
图 14-2 直观 设计 中 的 回收 吞吐 量 曲线 
在 一 个 回收 超级 周期 内 , 次 回收 的 吞吐 量 起 初 可 能 很 高 ， 因 为 之 前 刚 发 生 一 次 主 回收 ， 有 足 
够 的 空闲 区 域 。 然 后 厨 吐 量 就 越 来 越 低 ， 直 到 保留 空闲 区 域 不 足 ， 触 发 一 次 主 回收 
使 用 这 个 启发 式 设 计 , 可 以 及 早 触 发 主 回 收 ,甚至 是 在 还 有 足够 空闲 区 域 的 时 候 。 如 图 14-3 
所 示 ， 其 中 整体 吞吐 量 线 高 于 直观 设计 中 的 整体 吞吐 量 。 
wi 





m Ld m 
m > ım a : 
M a A Se i 
SRR EA HE Eee ik 
M 
ane ae eae 时 间 


图 14-3 ”启发 式 设计 中 的 回收 否 吐 量 曲 线 
这 一 节 开 发 的 启发 式 算法 只 对 特性 大 致 符合 这 里 描述 的 模型 的 应 用 程序 才 有 效 。 也 就 是 说 ， 
次 回收 中 的 存活 对 和 象 大 小 、 次 回收 的 回收 时 间 ， 以 及 主 回 收 的 回收 时 间 都 是 大 致 稳定 的 , 或 者 在 
一 个 超级 周期 里 线性 变化 的 
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使 用 并 发 回收 ， 有 可 能 并 发 执行 主 回 收 ， 那 么 触发 它 的 策略 就 可 能 有 所 不 同 。 特 别 是 一 些 
GC 设计 允许 主 回收 和 次 回收 同时 发 生 ， 使 其 回收 各 自 的 MOS 和 NOS 空间 。 这 种 情况 下 ， 对 主 
回收 和 次 回收 的 回收 调度 策略 大 体 上 是 互相 独立 的 。 
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如 果 堆 被 分 割 为 NOS 和 MOS, 关于 如 何 找到 活跃 对 象 , NOS 上 的 部 分 堆 回 收 有 两 个 设计 选 
择 。 一 个 选择 是 从 根 集 开始 遍历 整个 堆 ， 但 是 只 回收 NOS。 它 把 NOS 的 活跃 对 象 移动 到 MOS, 
但 MOS 中 已 有 的 对 象 保持 不 动 。 尽 管 MOS 对 象 没有 被 回收 ,但 回收 器 必须 遍历 MOS, 因为 NOS 
中 的 某 些 活跃 对 象 只 能 通过 包含 MOS 对 象 的 路 径 到 达 。 如 果 回 收 器 不 遍历 MOS, 这 些 对 象 就 不 
会 被 标记 为 活跃 , 这 是 错误 的 。 在 这 个 设计 中 ,虽然 回收 器 需 要 遍历 整个 堆 , 但 是 部 分 扒 回收 吞 
吐 量 可 能 要 高 于 全 堆 回 收 ， 因 为 NOS 可 能 只 有 少量 需要 回收 器 升级 的 活跃 对 象 ， 而 回收 的 空闲 
空间 大 小 (NOS 大 小 ) 可 以 很 大 。 

另 一 个 选择 是 分 代 设 计 。 它 不 会 遍历 MOS ， 而 是 使 用 记忆 集 ， 其 中 保持 了 所 有 从 MOS 到 
NOS 的 引用 。 这 些 从 老 一 代 (MOS ) 指向 年 轻 一 代 ( NOS ) 的 引用 称 为 跨 代 引用 。 回 收 器 只 需 
要 从 根 集 和 记忆 集 遍 历 NOS 即 可 。 如 果 一 个 引用 指向 MOS， 回 收 器 会 直接 忽略 它 。 


需要 写 屏 障 来 记录 所 有 从 MOS 到 NOS 的 引用 。 在 修改 天 执行 过 程 中 , 每 当 有 一 个 堆 写 入 在 
某 个 对 象 中 存储 一 个 引用 , 写 屏障 会 检查 这 个 引用 是 否 从 MOS 中 的 对 象 指向 NOS 中 的 对 象 。 如 
果 是 的 话 ， 这 个 引用 写 入 的 堆 槽 位 会 被 记录 到 记忆 集中 。 

注意 在 某 些 GC 算法 中 , 仅 在 修改 带 执 行 过程 中 记忆 相关 的 槽 位 是 不 够 的 。 跨 代 引 用 也 可 能 
是 在 回收 器 执行 的 过 程 中 创建 的 。 如 果 NOS 上 的 回收 没有 把 所 有 活跃 对 象 都 升级 到 MOS， 也 就 
是 说 ， 在 这 次 回收 之 后 NOS 中 仍然 保存 着 一 些 活路 对象， 那么 可 能 有 一 些 引 用 是 从 已 升级 的 对 
象 指向 未 升级 的 对 象 。 这 些 跨 代 引 用 也 应 该 被 记录 在 记忆 集中 。 当 回收 结束 并 且 修 改 顺 执 行 恢 
复 的 时 候 ， 记 忆 集中 已 经 有 一 些 成 员 。 它 们 与 修改 器 执行 过 程 中 新 记录 的 跨 代 引用 一 起 ， 在 下 
一 次 回收 中 被 使 用 。 在 对 象 图 遍历 使 用 了 记忆 集 之 后 ， 记 忆 集 被 清理 ， 然 后 可 能 再 次 生成 新 的 
记忆 集 。 

针对 图 14-4 中 的 堆 ， 下 面 的 代码 给 出 了 一 个 典型 写 屏 障 实现 。 


gc_write_barrer (Obj_header* src, Obj_header** slot, Obj_header* dst) 
{ 





*Sslot = dst; 


if( sre >= nos_boundary || dst < nos_boundary ) 
return; 
gc_add_remset_entry (slot); 
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nos_boundary 


图 14-4” 写 屏障 示意 图 


写 屏 障 在 时 间 和 空间 上 都 有 运行 时 开销 ,因为 它 需 要 检查 堆 中 每 次 的 引用 存储 , 并 记录 包含 
跨 代 引用 的 每 个 槽 位 。 在 某 些 GC 设计 中 采用 了 一 些 很 好 的 技术 来 降低 运行 时 开销 。 举 例 来 说 ， 
牌 桌 ( card-table ) 算法 有 时 可 以 降低 空间 上 的 开销 。 它 不 记录 每 个 堆 槽 位 ， 而 是 标记 包含 跨 代 引 
用 的 堆 区 域 (一 张 牌 )。 当 回收 发 生 时 ， 回 收费 扫描 标记 区 域 以 找到 跨 代 引用 。 牌 桌 算法 以 扫描 
牌 的 时 间 为 代价 来 节省 记忆 和 集 空间 。 在 本 书 的 讨论 中 ,除非 男 行 指出 , 槽 位 集 和 上 牌 介 都 用 记忆 集 
来 指 代 。 

记忆 和 集 还 有 男 一 个 问题 。 尽管 它 保证 了 一 次 回收 永远 不 会 错过 标记 任何 活跃 对 象 , 但 是 它 可 
能 会 有 很 多 NOS 中 标记 的 对 象 实际 上 已 经 死亡 。 原因 在 于 , 在 MOS 中 持 有 记忆 集中 槽 位 的 对 象 
本 身 可 能 已 经 死 掉 了 。 回 收 器 不 遍历 MOS 就 无 法 了 解 这 个 事实 。 一 旦 被 保留 ， 这 些 被 错误 标记 
的 死亡 对 象 就 成 了 漂浮 垃圾 ， 其 数量 可 能 大 到 足以 抵消 分 代 式 回收 的 优势 。 

有 时 候 分 代 部 分 堆 回 收 的 吞吐 量 可 能 低 于 它 的 非 分 代 对 应 算法 。 这 个 平衡 主要 受到 三 个 因素 
的 影响 : 写 屏障 的 开销 、 漂 浮 垃 圾 的 数量 ， 以 及 MOS 中 活跃 对 象 的 数量 ( 即 工 作 集 大 小 )。 举例 
来 说 ， 在 一 个 应 用 程序 执行 的 早期 阶段 ，MOS 不 包含 或 包含 少量 活跃 对 象 。 非 分 代 回 收 显然 更 
高 效 ， 因 为 NOS 回收 不 会 浪费 太 多 时 间 在 遍历 MOS Eo 

通过 Java 基准 测试 SPECJBB 得 到 的 非 分 代 回 收 吞吐 量 曲线 如 图 14-5 所 示 。 

吞吐 量 





整体 吞吐 量 





时 间 
图 14-5 非 分 代 回 收 的 吞吐 量 曲线 
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应 的 分 代 算 法 的 曲线 如 图 14-6 所 示 ， 用 更 粗 的 线 和 更 深 的 颜色 表示 。 方 形 点 是 否 吐 量 值 
Kho sleet el NOS 大 小 保持 不 变 ， 因 为 更 大 的 NOS 大 小 通常 意味 着 记忆 集会 保留 更 多 漂 
a (在 两 代 布局 中 ) 否 吐 量 可 能 无 法 从 更 大 的 NOS 大 小 中 获 益 。 
注意 两 个 曲线 中 主 回收 的 吞吐 量 是 一 样 的 。 主 回收 是 全 堆 回 收 ， 因 此 不 受 分 代 与 否 的 影响 。 当 
我 们 讨论 分 代 回 收 的 时 候 , 仅 指 次 回收 。 圆 点 表示 的 非 分 代数 据 也 一 起 展示 在 图 14-6 F, 用 于 对 比 。 
吞吐 量 





时 间 


图 14-6 “分 代 回 收 的 吞吐 量 曲线 
这 个 基准 测试 中 , 分 代 回 收 香 吐 量 是 线性 的 , 在 回收 超级 周期 的 起 始 阶段 ,吞吐 量 相对 于 非 
分 代 回 收 会 比较 低 ， 而 在 第 二 阶段 则 会 高 一 些 。 这 种 情况 下 , 通过 自 适 应 策略 在 分 代 与 非 分 代 算 
法 之 间 选 取 适 当 的 回收 方法 ， 有 助 于 提高 整体 否 吐 量 。 
其 思路 就 是 让 吞吐 量 曲线 采用 非 分 代 和 分 代 曲 线 中 较 高 的 部 分 , 那么 这 个 自 适应 设计 的 整体 
吞吐 量 就 会 高 于 其 中 任何 一 个 ,如 图 14-7 所 示 。 黑 色 曲 线 是 分 代 曲线 和 非 分 代 曲 线 的 合并 。 注 意 
在 某 些 应 用 程序 中 分 代 回收 益 是 好 于 非 分 代 回收 ， 或 者 相反 。 这 样 的 情况 就 不 需要 在 两 种 回收 模 


式 中 切换 。 
吞吐 量 14 


整体 吞吐 量 





一 一 全 


时 间 
图 14-7 ”分 代 与 非 分 代 自 适应 式 回收 的 吞吐 量 曲线 
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针对 这 样 一 个 自 适应 设计 的 问题 就 是 ， 如 何 找到 两 种 模式 的 正确 切换 时 机 。 应 该 利用 即时 
(JIT) 编译 带 为 每 个 堆 写 入 插入 写 屏 障 , 使 得 分 代 模 式 成 为 可 能 。 写 屏障 里 比 之 前 多 了 一 个 回收 
模式 检查 。 如 果 是 非 分 代 模 式 ， 就 简单 地 直接 返回 。 这 个 写 屏 障 的 伪 代 人 码 如 下 所 示 : 

void gc_write_barrer(Obj_header* src, Obj_header** slot, Obj_header* dst) 


{ 
*slot = ast; 


if( collection_mode != GC_GENERATIONAL ) 
return; 

if( sre >= nos_boundary || dst < nos_boundary) 
return; 


gc_add_remset_entry(slot); 
} 


如 果 写 屏障 用 “ 非 安全 Java” 编 写 ， 并 且 被 内 联 到 编译 后 Java 代码 中 ,那么 非 分 代 模式 中 
写 屏障 用 于 模式 检查 的 开销 可 以 忽略 不 计 。 这样 一 来 , 无 论 回收 是 否 分 代 , 插入 写 屏障 都 没有 什 
么 问题 。 

为 了 在 下 次 回收 中 能 够 打开 分 代 模 式 , 需要 在 当前 回收 中 决定 是 否 下 次 回收 需 切 换 模式 , 而 
FRE EME RRR IT ZA, 这样 写 屏 障 才 能 记忆 跨 代 引 用 。 同时， 当前 回收 费 应 该 记忆 跨 代 引 
用 ， 以 防 GC 决定 将 下 一 次 回收 切换 为 分 代 模 式 。 

为 了 解 哪 种 模式 的 吞吐 量 更 高 , 自 适 应 策略 需要 在 某 些 时 刻 运行 两 种 模式 。 这 个 设计 可 以 把 
第 一 个 超级 循环 用 作 初 始 数据 收集 。GC 在 前 几 个 次 回收 中 运行 非 分 代 模 式 ， 然 后 在 接 下 来 的 次 
回收 中 运行 分 代 模 式 。 另 一 种 方法 是 一 直 运 行 非 分 代 次 回收 , 直到 启发 式 算法 决定 下 一 次 回收 运 
行 主 回收 ， 然 后 GC 切换 到 分 代 模 式 次 回收 而 不 是 主 回 收 ， 直 到 保留 的 空闲 空间 不 足 时 才 触 发 一 
次 主 回收 。 通 过 这 两 种 方式 ，GC 都 可 以 在 第 一 个 超级 周期 之 后 了 解 两 种 模式 的 最 大 、 最 小 和 平 
均 吞 吐 量 。 

如 果 在 第 一 次 超级 周期 分 析 中 , 所 有 非 分 代 回 收 的 吞吐 量 都 不 高 于 最 大 分 代 回 收 , 那么 下 一 
个 超级 周期 中 的 所 有 回收 都 会 运行 分 代 模 式 ， 直 到 GC 在 下 一 次 主 回收 中 另行 决定 。 和 否则 ，GC 
会 在 下 一 个 超级 周期 的 第 一 次 回收 中 运行 非 分 代 模 式 。 这 是 常见 的 情况 ,因为 在 应 用 程序 执行 的 
初始 阶段 ，MOS 中 只 有 少数 几 个 活跃 对 象 , 所 以 非 分 代 模 式 通常 更 好 。 刚 发 生 一 次 主 回收 之 后 ， 
有 大 量 空闲 空间 。 这 些 空闲 空间 足以 支持 应 用 程序 运行 很 长 时 间 ， 然 后 在 下 一 次 垃圾 回收 之 前 ， 
其 中 新 创建 的 对 象 多 数 都 已 死亡 ， 分 代 模 式 可 能 会 大 量 保留 它们 , 使 其 成 为 漂浮 垃圾 , 特别 是 在 
两 代 堆 布局 (NOS 和 MOS ) 的 情况 中 。 我 们 将 在 后 面 深 入 讨论 这 一 点 。 

由 于 GC 决定 在 下 一 个 超级 周期 的 第 一 次 回收 中 运行 非 分 代 模式 , 它 需 要 知道 何 时 切换 到 分 
代 模 式 。GC 会 在 当前 回收 之 前 预测 下 一 次 回收 的 吞吐 量 。 一 个 简单 的 模型 是 使 用 当前 吞吐 量 作 
为 下 一 次 吞吐 量 的 预测 值 。GC 继续 使 用 非 分 代 回 收 ， 直 到 预测 吞吐 量 低 于 分 代 模 式 的 平均 吞吐 
量 ， 这 个 值 是 在 第 一 次 超级 周期 中 获得 的 。 然 后 GC 就 切换 到 分 代 模 式 ， 直 到 和 触发 主 回收 。 在 这 
个 超级 周期 内 ， 它 不 会 再 次 切换 回 非 分 代 模 式 ， 因 为 回收 吞吐 量 曲线 告诉 我 们 , 在 同一 个 超级 周 
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期 内 ， 非 分 代 横 式 不 太 可 能 在 后 面 变 得 更 好 。 原 因 是 可 以 理解 的 : 通常 MOS 中 的 活跃 对 象 会 更 
多 ， 可 以 回收 的 空闲 空间 也 会 更 小 。 

从 第 三 个 超级 周期 开始 , 如 果 上 一 次 超级 周期 中 有 非 分 代 回 收 , 那么 新 超级 周期 总 是 从 非 分 
代 回 收 开始 ， 接 着 是 上 面 介绍 的 启发 式 算法 。 如 果 上 一 个 超级 周期 中 只 有 分 代 回 收 ，GC 会 检查 
它 的 主 回收 存活 率 来 决定 下 一 个 超级 周期 的 首次 回收 类 型 。 主 回收 是 一 次 超级 周期 的 最 后 一 次 
回收 。 


一 个 被 回收 空间 的 存活 率 定 义 为 这 个 空间 内 存活 对 象 的 总 大 小 与 这 个 空间 大 小 的 比值 ， 也 





就 是 
Survival_rate(space) = (2 size(live_object © space))/ size(space) 
一 次 主 回收 的 存活 率 用 以 下 公式 计算 : 
Survival_rate(heap) = (3 size(live_object © heap) )/size(heap) 
一 次 次 回收 的 存活 率 用 以 下 公式 计算 : 
Survival_rate(NOS) = (3 size(live_object © NOS))/size(NOS) 
存活 率 是 死亡 率 的 补 数 : 
Mortality_rate(space) = 1 - survival_rate(space) 


存活 率 是 一 个 重要 的 数据 项 , 它 反映 了 应 用 程序 对 象 死亡 的 速度 。 当 存活 率 很 低 的 时 候 , 应 用 程 
序 在 回收 之 后 没有 太 多 活跃 对 象 能 够 存活 。 应 用 程序 可 以 得 到 很 高 的 回收 吞吐 量 。 进 一 步 讲 , 对 
于 次 回收 ， 这 意味 着 两 点 : 第 一 点 ，NOS 中 多 数 分 配 的 对 象 都 是 垃圾 ; 第 二 点 ，MOS 中 活跃 对 
象 的 数量 不 多 。 第 一 点 意味 着 ， 如果 次 回收 使 用 分 代 模 式 ， 那 么 记忆 集 保留 的 漂浮 垃圾 可 能 导致 
无 法 得 到 同样 量 级 的 存活 率 。 第 二 点 意味 着 , 遍历 MOS 空间 寻找 活跃 对 象 可 能 不 会 带 来 高 开销 。 
综合 起 来 说 ， 较 低 的 存活 率 暗 示 着 非 分 代 模 式 可 能 会 获得 比分 代 模 式 更 好 的 回收 吞吐 量 。 

如 果 上 一 个 超级 周期 中 所 有 回收 都 使 用 分 代 模 式 , 那 就 没有 机 会 运行 非 分 代 横 式 并 对 比 吞 叶 
量 。 来 自主 回收 的 数据 可 以 用 来 推断 非 分 代 模 式 的 潜在 收益 ,因为 主 回 收 也 是 非 分 代 模 式 的 。 当 
一 次 主 回收 的 存活 率 低 于 之 前 采样 的 非 分 代 回 收 的 平均 存活 率 时 , 就 值得 在 新 超级 周期 的 第 一 次 
回收 钟 试 一 下 非 分 代 模 式 ， 这 可 能 会 带 来 更 高 的 吞吐 量 。 

再 次 强调 ， 这 个 启发 式 策略 并 不 能 广泛 适用 于 所 有 应 用 程序 。GC 优化 就 是 研究 应 用 程序 特 
性 并 试图 找到 足够 适用 的 算法 和 策略 的 过 程 。 对 于 有 具体 的 应 用 程序 而 言 , 额外 的 调整 通常 有 助 于 
获得 更 多 改进 
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一 个 应 用 程序 启动 之 后 ，VM 需要 决定 一 开始 分 配 多 大 的 堆 ， 这 是 个 问题 。 显 然 , 堆 是 越 大 
越 好 ， 因 为 这 样 一 来 ,应 用 程序 就 不 会 触发 回收 ， 所 有 应 用 程序 时 间 都 用 在 修改 器 计算 上 。 但 这 
不 一 定 是 个 好 主意 。 最 起 码 不 可 能 分 配 无 限 大 的 堆 空 间 ， 所 以 必须 要 有 一 个 大 小 限制 。 
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14.3.1 空间 大 小 扩展 


VM 不 需要 一 开始 就 提交 很 大 的 推 空间 ,因为 应 用 程序 在 它 的 生存 期 内 可 能 不 会 分 配 很 多 对 
Ro 或 者 ， 即 使 它 分 配 很 多 对 象 ， 但 可 外 re ee 
所 以 一 开始 选择 的 堆 空 间 大 小 可 以 控制 在 一 个 合理 的 较 小 数值 内 , 然后 运行 期 间 再 根据 系统 内 存 
可 用 性 和 应 用 程序 特性 进行 调整 。 


初始 堆 大 小 是 一 个 经 验 值 。 然 后 在 每 次 回收 之 后 ，GC 根据 剩余 的 空闲 空 
决定 新 的 堆 大 小 。 在 实际 实现 中 ， 可 能 只 在 主 回收 后 调整 堆 大 小 ， 以 避免 频繁 调整 开销 。 男 
原因 是 主 回收 有 整个 堆 的 数据 ， 可 以 帮助 调整 决策 。 

通常 VM 有 一 个 由 应 用 程序 运行 器 (application runner ) 或 系统 平台 给 出 的 堆 大 小 最 大 值 。 
一 开始 先 保 留 最 大 堆 大 小 , 但 是 只 提交 初始 堆 大 小 。 也 就 是 说 , 保留 最 大 大 小 的 虚拟 空间 , 但 只 
提交 了 初始 大 小 的 物理 空间 。 空 间 保 留 不 是 必需 的 , 但 是 它 有 助 于 预 留 一 段 连续 的 地 址 空间 。 之 
后 当 物 理 空间 提交 时 , 可 以 确定 它 会 映射 到 期 望 的 连续 虚拟 地 址 上 。 大 对 象 分 配 需 要 连续 虚拟 空 
间 ， 而 且 如 果 缓 存 用 虚拟 地 址 索引 的 话 , 这 也 有 助 于 缓存 局 部 性 ,多数 当 代 处 理 器 都 用 虚拟 地 址 
索引 缓存 。 

可 以 使 用 下 面 的 系统 调用 保留 、 提 交 、 人 解除 提交 ， 以 及 释放 内 存 。 

Windows 中 : 

口 保留 
VirtualAlloc(start_addr, size, MEM_RESERVE, PAGE_READWRITE) ; 
口 提交 
VirtualAlloc(start_addr, size, MEM_COMMIT, PAGE_READWRITE) ; 
口 解除 提交 
VirtualFree(start_addr, size, MEM_DECOMMIT) ; 
O 释放 
VirtualFree(start_addr, 0, MEM RELEASE); 
Linux 中 : 
口 保留 
mmap(0, size, PROT_NONE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0); 


mmap(start_addr, size, PROT_NONE, MAP_FIXED|MAP_PRIVATE|MAP_ 
ANONYMOUS, -1, 0); 


O 提交 
mprotect (start_addr, size, PROT_READ| PROT_WRITE); 


O 解除 提交 


mprotect (start_addr, size, PROT_NONE) ; 
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口 释放 
munmap(start_addr, size); 
Linux 现在 有 了 mremap， 可 以 用 来 收缩 或 扩展 一 个 映射 后 区 域 ， 对 于 提交 和 解除 提交 实现 
也 很 方便 。Windows 可 以 使 用 地 址 窗口 扩展 ( Address Windowing Extensions, AWE ) 来 锁定 已 分 
配 内 存 ， 保 证 不 会 被 换 页 换 出 。 


一 个 简单 的 用 来 扩展 或 收缩 堆 大 小 的 启发 式 算 法 ， 可 以 使 用 如 下 公式 : 


口 对 于 扩展 
if( survival_rate > max_survival_rate ) 
new_heap_size = surviving_object_size/expected_survival_rate 
O 对 于 收缩 
if( survival_rate < min_survival_rate ) 
new_heap_size = surviving_object_size/expected_survival_rate 


FLARE. ROR BAA EA Re GU, 可 以 是 最 大 值 为 13、 最 小 值 为 1/8， 
以 及 期 望 值 为 1$。 这 意味 着 ， 如 果 存 活 对 象 占据 堆 的 1/3 以 上 , 或 者 堆 的 118 以 下 ,那么 GC 就 
应 该 调整 堆 来 使 得 它们 只 占据 堆 的 /5。 图 14-8 展示 了 堆 扩 展 的 情形 。 


堆 地 址 
低地 址 高 地 址 
回收 前 





图 14-8 生存 率 高 于 某 个 半 值 时 的 堆 扩 展 


存活 率 高 的 时 候 就 扩展 堆 , 其 中 的 逻辑 是 , 两 次 回收 之 间 应 该 有 足够 长 的 时 间 让 很 多 新 分 配 
对 象 死亡 。 要 得 到 更 好 的 启发 式 算法 结果 , 还 可 以 考虑 回收 时 间 和 修改 时 间 ( 两 次 回收 之 间 的 时 
间 ) 的 比值 。 如 果 回 收 时间 与 修改 时 间 相 比 太 短 ， 就 不 需要 扩展 堆 ， 因 为 应 用 程序 可 能 没有 大 量 
分 配对 象 。 换 名 话说， 对 于 这 类 应 用 程序 ， 堆 并 不 是 提高 性 能 的 稀缺 资源 。 


14.3.2 NOS 大 小 


一 旦 确定 了 堆 大 小 , 接 下 来 的 问题 就 是 把 多 大 空间 指派 给 对 象 分 配 。 既 然 单 赵 的 对 象 追 踪 转 
发 算法 比 起 需要 多 趟 的 就 地 回收 有 更 高 的 吞吐 量 , 所 以 常见 情况 是 ,只 要 可 能 ,就 对 新 分 配对 象 
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使 用 追踪 转发 算法 .这 需要 有 足够 的 保留 空闲 区 域 用 于 对 象 升级 .在 有 NOS 和 MOS 布局 的 堆 中 ， 
HURAY NOS 大 小 应 该 满足 下 面 的 不 等 式 : 
nos_size * nos_survival_rate <= reserved_free_size 
既然 有 
reserved_free_size = free_size - nos_size 
那 就 可 以 推导 出 NOS 大 小 : 


nos_size <= free_size/(1l+nos_survival_rate) 


可 以 在 每 次 回收 之 后 ,以 及 修改 器 执行 恢复 之 前 ,调整 NOS 大 小 ,既然 次 回收 不 会 回收 MOS， 
那么 NOS 的 可 用 空间 会 越 来 越 小 ， 直 到 触发 一 次 主 回 收 。 前 文 已 经 讨论 过 ， 持 续 执行 次 回收 直 
到 可 用 空间 用 尽 是 不 合理 的 。 可 以 及 早 触发 主 回 收 以 得 到 最 大 整体 吞吐 量 。 图 14-9 展示 了 这 个 
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图 14-9 指派 用 于 新 对 象 分 配 的 空间 


有 些 分 代 式 GC 设计 没有 采用 可 变 NOS 空间 。 使 用 固定 大 小 的 NOS， 可 以 在 存活 对 象 被 升 
级 之 后 , 通过 增加 MOS 空间 来 逐渐 扩展 堆 。 使 用 固定 大 小 的 NOS 的 更 加 重要 的 原因 是 , 两 代 布 
局 的 分 代 式 GC 可 能 不 会 从 更 大 的 NOS 大 小 中 得 到 更 高 的 吞吐 量 。 


在 两 代 GC 设计 中 ,如 图 14-9 所 示 , 在 一 次 次 回收 中 , 所 有 新 创建 对 象 中 活跃 的 那些 都 被 升 
级 到 MOS 中 。 既 然 相 近 时 间 内 创建 的 对 象 通常 会 彼此 引用 ， 当 修改 器 恢复 执行 ,并 开始 在 NOS 
中 分 配对 象 时 , MOS 中 被 升级 的 新 生 对 象 和 NOS 中 的 新 生 对 象 很 可 能 彼此 引用 ,一 段 时 间 之 后 ， 
这 些 新 生 对 象 中 的 大 部 分 都 已 死亡 ， 这 些 跨 代 引用 会 使 得 NOS 中 的 对 象 在 分 代 次 回收 中 存活 。 
进一步 讲 ，NOS 中 这 些 死去 却 被 保留 的 新 生 对 象 还 会 使 得 更 新 的 新 生 对 象 活着 。 结 果 就 是 大 量 
漂浮 垃圾 被 保留 。 这 导致 了 对 象 图 遍历 和 活跃 对 象 移动 过 程 中 的 巨大 开销 。 这 些 漂浮 垃圾 会 被 升 
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级 到 MOS 并 保留 在 那里 , 直到 触发 一 次 主 回收 , 这 使 得 堆 更 快 变 满 ， 导 致 更 短 的 超级 回收 周期 。 
要 点 就 是 ， 在 两 代 设 计 中 ， 更 大 的 NOS 大 小 也 许 并 不 能 带 来 更 好 的 回收 吞吐 量 。 


14.3.3 ”部 分 转发 NOS 设计 


一 个 更 好 的 NOS 设计 方案 是 再 引入 一 代 ， 以 此 给 新 生 对 象 更 多 的 时 间 来 成 熟 。 例 如 ， 在 次 
回收 中 ， 只 有 NOS 中 比较 老 的 那 一 半 活 跃 对 象 升级 ( 称 为 “升级 的 一 半 ”), 在 下 一 次 次 回收 中 ， 
升级 另外 一 半 ， 如 图 14-10 所 示 。 这 个 设计 称 为 “部 分 转发 "， 可 以 从 更 大 的 NOS 大 小 中 受益 。 
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图 14-10 ”部 分 转发 示意 图 


部 分 转发 通过 回收 后 提升 一 半 较 老 的 新 生 对 象 , 成 为 在 简单 的 两 代 设 计 上 的 一 个 改进 。 它 有 
效 地 减少 了 漂浮 垃圾 的 数量 。 但 它 也 不 是 没有 缺点 。 一 个 问题 是 未 升级 的 那 一 半 没 有 回收 死亡 对 
象 ， 而 其 数量 可 能 很 大 , 会 占用 不 少 空间 ,尽管 这 一 半 参 与 了 对 象 图 遍历 ， 其 中 死亡 对 象 是 已 知 
的 。 换 名 话说 , 这 导致 更 少 的 空闲 空间 和 更 长 的 遍历 时 间 , 可 能 给 次 回收 的 否 吐 量 带 来 负面 影响 。 
另外 一 个 轻 一 点 的 问题 是 ， 当 没有 升级 的 一 半 与 MOS 相 邻 时 ， 不 能 通过 向 NOS 一 侧 移动 NOS 
边界 (nos_boundary ) 来 给 MOS 更 多 的 保留 空闲 区 域 。 当 被 提升 的 部 分 与 MOS 相 邻 时 ， 可 能 
就 不 得 不 更 早 触 发 一 次 主 回收 , 或 者 在 上 一 次 次 回收 中 保留 超过 所 需 的 空间 。 不 管 哪 种 都 不 是 好 
的 解决 方案 。 


14.3.4 ”半空 间 NOS 设计 
另 一 个 与 部 分 转发 不 同 的 设计 是 升级 NOS 中 所 有 的 活跃 对 象 , 但 不 将 其 放 到 MOS 中 , 而 是 
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将 其 升级 到 NOS 中 的 保留 空闲 区 域 , 以 避免 向 MOS 中 移动 新 生 对 象 。 这 可 以 被 看 作 惠 分 代 控制 
的 半空 间 算法 。 也 就 是 说 ，NOS 被 分 割 为 两 半 ， 一 半 用 于 分 配 ， 男 一 半 用 作 次 回收 中 第 一 次 活 
路 对象 升级 的 保留 空 闪 区 域 。 

我 们 定义 了 年 龄 (age ) 来 表示 一 个 对 象 在 回收 中 存活 的 次 数 。 在 次 回收 中 ， 年 龄 小 于 1 的 
活跃 对 象 被 升级 到 NOS 保留 空 亲 区域。 那些 比 1 更 老 的 对 象 可 以 被 升级 到 MOS 保留 空闲 区 域 ， 
或 者 被 再 次 移动 到 NOS 保留 空 闪 区 域 ， 同 时 年 龄 增加 。 活 跃 对 象 在 什么 年 龄 会 被 升级 到 MOS 
是 一 个 设计 决策 。 在 通常 的 设计 中 , GC 升级 年 龄 为 1 岁 的 活跃 对 象 到 MOS, 不 等 它们 年 龄 更 大 。 
图 14-11 中 展示 了 这 个 过 程 。 我 们 称 之 为 “分 代 半空 间 ” 算 法 。 
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图 14-11 分 代 半 空间 示意 图 


在 这 个 设计 中 ，NOS 的 保留 空闲 区 域 被 用 作 NOS 内 的 额外 一 代 。 既 然 没 有 新 生 对 象 升级 到 
MOS, 这 个 设计 可 以 得 到 与 部 分 转发 一 样 的 结果 , 但 是 它 并 没有 解决 部 分 转发 的 关键 问题 。 NOS 
空间 用 来 分 配 的 一 半 和 一 岁 对 象 共享 ，NOS 中 只 有 不 到 一 半 的 空间 用 作对 象 分 配 ， 这 甚至 比 部 
分 转发 更 差 。 既 然 次 回收 需要 扫描 一 岁 对 象 ， 所 以 追踪 时 间 和 部 分 转发 方法 一 样 。 
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14.3.5 aged-mature NOS 设计 


分 代 半 空间 比 部 分 转发 的 空间 效率 更 低 , 因为 它 在 NOS 中 保留 了 远 远 超出 需要 的 空闲 区 域 。 
保留 空间 只 要 能 放下 提升 的 新 对 象 就 足够 了 。 基 于 这 个 观察 结果 ， 我 们 可 以 有 如 下 设计 。 


这 个 设计 在 NOS 中 引入 了 中 年 一 代 。 中 年 一 代 分 为 两 半 。 一 半 保 留用 于 下 一 次 次 回收 中 升 
级 的 新 对 象 ( 称 为 “保留 的 一 半 ”)。 另外 一 半 持 有 上 次 次 回收 升级 的 对 象 ( 称 为 “升级 的 一 半 ”)， 
这 一 半 在 下 一 次 次 回收 中 将 被 升级 到 MOS 中 。 与 半空 间 算 法 中 一 样 ， 这 个 设计 也 可 以 选择 在 下 
一 次 次 回收 中 把 升级 的 一 半 移 动 到 保留 的 一 半 ， 等 到 它们 足够 老 的 时 候 才 把 它们 升级 到 MOS. 
根据 我 们 的 经 验 , 在 1 岁 时 升级 到 MOS 通常 已 经 足够 好 了 。 注意 中 年 一 代 是 在 NOS 内 部 的 ,所 
以 记忆 集 只 记录 跨 NOS-MOS 边界 的 引用 。 

这 个 设计 是 分 代 半 空间 算法 的 一 个 变 体 。 区 别 在 于 , 这 里 的 分 配 空间 大 小 是 可 变 的 , 并且 要 

能 大 。 既 然 用 于 分 配 的 NOS 空闲 区 域 总 是 与 MOS 相 邻 , 那么 很 容易 通过 调整 NOS 边界 为 
MOS 人 x 间 。 我 们 把 这 个 设计 称 为 “aged-mature”( 经 年 成 熟 ) 算法 。 
图 14-12 中 展示 了 这 个 过 程 。 
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图 14-12 aged-mature 示意 图 
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使 用 aged-mature 算法 ， 空 间 利用 率 比 部 分 转发 或 分 代 半 空间 算法 要 高 。NOS 的 中 年 一 代 可 
以 很 小 , 只 要 它 能 够 放下 两 次 次 回收 中 升级 的 新 对 象 就 可 以 了 。 留 给 新 对 象 分 配 的 空间 大 小 如 下 
所 示 。 


在 aged-mature 方法 中 : 

allocation_space_size = nos_size - 2*nos_size*nos_survival_rate 
在 部 分 转发 或 分 代 半 空间 方法 中 : 

allocation_space_size = nos_size/2 


满足 以 下 条 件 ，aged-mature 的 分 配 空间 较 大 。 


nos_size - 2*nos_size*nos_survival_rate > nos_size/2 


可 以 推导 出 aged-mature 方法 要 得 到 更 高 吞吐 量 所 需要 的 条 件 。 这 个 条 件 是 普通 应 用 程序 的 
一 般 情 况 。 

nos_survival_rate < 1/4 

现实 中 ， 中 年 一 代 “ 保 留 的 一 半 ” 大 小 应 该 要 保守 一 点 ， 以 确保 新 对 象 升级 有 足够 的 空间 。 
然而 ,“ 升 级 的 一 半 ” 中 剩余 的 空闲 区 域 也 可 以 用 作 分 配 ， 就 像 半 空间 一 样 ， 没 有 任何 问题 ， 如 
图 14-13 所 示 。 
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图 14-13 aged-mature 设计 中 充分 利用 NOS 空间 
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14.3.6” 回 退回 收 


NOS 和 MOS 中 都 有 了 基于 存活 率 和 某 个 保守 余 计 空 间 计 算出 的 保留 空闲 区 域 , 这 种 设计 在 
多 数 回收 中 都 运行 良好 。 但 是 它 仍然 需要 处 理 可 能 出 现 的 回收 中 存活 率 明 显 高 于 预测 值 的 情况 。 

如 果 NOS 中 保留 空闲 区 域 不 够 的 话 ， 可 以 把 剩余 活跃 对 象 直 接 移 动 到 MOS ， 而 不 是 中 年 一 
代 。 如 果 MOS 中 保留 空间 不 够 ， 就 需要 触发 一 次 全 堆 上 的 回 退 为 就 地 回收 。 也 就 是 说 ， 它 在 未 
完成 的 次 回收 当中 匆匆 切换 为 主 回 收 , 注意 , 当 保留 空间 不 足 的 时 候 , 不 应 该 触发 内 存 不 足 异 常 。 
垃圾 回收 永远 都 不 应 该 触发 内 存 不 足 异常 ， 因为 在 回收 之 前 所 有 对 象 已 经 都 存在 。 如 果 一 次 回收 
需要 的 空间 比 可 用 空间 更 多 ， 那 么 这 个 算法 是 有 缺陷 的 。 

ENE El (fallback collection ) 算法 通 稼 是 标记 压缩 ， 尽 管 这 不 是 强制 性 的 。 因 为 回 退回 收 
需要 在 用 于 次 回收 的 已 有 堆 组 织 上 操作 ,所 以 如 果 回 退回 收 和 次 回收 使 用 类 似 的 堆 组织 , 那么 会 
更 简单 一 些 。 既 然 次 回收 使 用 移动 式 GC， 那 么 很 自然 地 ， 在 回 退 回收 中 使 用 的 也 是 移动 式 GC 
的 标记 压缩 算法 。 另 外 一 个 就 地 回收 的 标记 清除 算法 ， 其 堆 组 织 通常 与 移动 式 GC 的 堆 组 织 方式 
区 别 很 大 ， 比 如 ， 可 能 使 用 size-segregated ( 离散 尺寸 的 ) 列表 。 尽 管 仍 然 可 以 使 用 标记 清除 回 
收 作为 回 退 回收 ， 但 这 不 是 一 个 直观 的 设计 。 


回 退 回收 就 像 是 一 次 主 回收 , 但 是 比 善 通 的 主 回 收 更 加 复杂 。 所 有 被 转发 的 对 象 都 有 两 个 副 
Æ: NOS 分 配 空间 中 的 旧 副 本 ， 以 及 NOS 或 MOS 中 保留 空间 中 转发 来 的 新 副本 。 我 们 不 能 包 
单 地 删除 任何 一 个 副本 ， 因 为 回 退 发 生 的 时 候 ， 二 者 都 可 能 被 其 他 活跃 对 象 引 用 。 

可 以 通过 恢复 旧 副 本 所 有 信息 ， 然 后 把 所 有 指向 新 副本 的 引用 重新 指 回 旧 副 本 来 移 除 新 副 
本 。 这 些 引 用 可 能 来 自 其 他 对 象 、 根 集 和 记忆 集 。 这 种 方法 试图 只 保留 活路 对象 的 一 个 旧 副 本 ， 
因为 有 些 活跃 对 象 在 回 退 回收 发 生 的 时 候 还 没有 新 副本 。 实 际 上 ， 要 保证 回 退 回收 的 正确 性 ， 
GC 不 一 定 只 能 使 用 旧 副 本 。 接 下 来 的 算法 更 有 效 。 作 为 主 回 收 ， 回 退回 收 首先 需要 遍历 堆 来 标 
记 可 达 对 象 。 回 收费 到 达 一 个 对 象 时 , 会 扫描 对 象 的 所 有 引用 字段 。 如 果 还 有 引用 指向 已 转发 对 
象 的 原始 副本 ， 回 收 需 就 更 新 这 个 引用 指向 新 副本 。 如 此 一 来 ， 在 追踪 阶段 之 后 ， 堆 状态 变 为 
一 致 : 所 有 的 引用 都 只 能 指向 活跃 对 象 的 一 个 副本 。 回 退回 收 可 能 需要 在 对 象 头 中 使 用 位 来 指示 
标记 过 的 活跃 对 象 , 这 些 位 不 同 于 未 完成 的 次 回收 所 使 用 的 活跃 标记 指示 位 ,这 样 回收 器 不 会 被 
已 经 过 时 的 副本 所 迷惑 。 

全 堆 回 收 可 能 无 法 把 所 有 活跃 对 象 移动 到 MOS。 这 不 是 一 个 问题 ， 因 为 整个 堆 现在 都 被 当 作 
一 个 单独 的 空间 。 当 回收 结束 的 时 候 ，GC 把 堆 再 次 分 割 为 NOS Fil MOS, 准备 开始 下 一 次 次 回收 。 
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在 NOS/MOS HE fi Jay, GC 只 把 NOS 用 于 对 象 分 配 ,， 所 以 空间 调整 主要 是 在 新 对 象 的 分 配 
空间 与 供 存活 对 象 使 用 的 (一 个 或 多 个 ) 其 他 空间 之 间 进 行 。 因此， 存活 率 是 调整 启发 式 算法 的 
主要 因素 。 当 GC 有 多 个 分 配 空间 时 , 分配 空间 竞争 空间 堆 空间 ， 并且 它 们 也 不 再 为 存活 率 所 束 
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缚 。 此 时 需要 新 的 启发 式 算法 为 它们 分 配 堆 空间 。 


把 大 对 象 放 在 单独 空间 中 管理 是 很 常见 的 ， 不 是 必需 的 。 大 对 象 是 指 大 小 大 于 一 个 
a a 


ARAE, AD PIN GC ( 特别 是 复制 式 GC ) 比 非 移动 式 GC 有 更 好 的 否 吐 量 ， 
但 是 只 有 在 移动 对 象 的 开销 相对 较 低 的 时 候 才 是 这 样 , 例如 相 比 于 对 象 图 遍历 这 样 的 开销 。 大 对 
象 导致 高 移动 成 本 ， 可 能 会 失去 移动 式 GC 的 优势 。 


男 一 个 原因 是 , 移动 式 GC 通常 把 它 的 空间 组 织 为 大 小 相等 的 单元 ， 比 如 块 ， 来 得 到 更 好 的 
数据 局 部 性 ， 更 好 的 OS 支持 ,或 者 对 于 多 回收 器 来 说 更 简单 的 任务 并 行 化 。 有 些 大 对 象 可 能 比 
预定 义 的 块 大 小 还 要 大 ， 这 就 要 求 特 殊 的 GC 设计。 

除了 大 对 象 需要 额外 分 配 空间 这 一 情况 ， 有 些 GC 可 能 支持 锁定 对 象 。 锁定 对 象 是 在 回收 期 
间 不 能 移动 的 。 如 果 把 锁定 对 象 和 非 锁 定 对 象 放 在 同一 个 空间 ， 移 动 式 GC 的 设计 就 复杂 化 了 。 
可 以 把 锁定 对 象 放 到 独立 的 空间 中 。 还 有 男 外 一 个 情况 就 是 ， 有 些 GC 可 能 把 永存 对 象 放 在 一 
“永存 空间 ”中 ， 这 些 对 象 生成 之 后 是 一 直 活 跃 的 。 


如 果 GC 有 多 个 分 配 空间 ， 比 如 LOS 和 非 LOS， 二 者 之 间 的 堆 空间 分 配 就 是 一 个 挑战 。 在 
理想 的 设计 中 , 它们 可 以 共享 同一 个 空闲 区 域 用 于 分 配 。 当 这 个 空闲 区 域 用 完了 之 后 ， 就 触发 一 
次 回收 , 根据 策略 的 不 同 , 可 以 一 并 回收 LOS 和 非 LOS, 也 可 以 只 回收 其 中 之 一 。 这 种 方式 中 ， 
LOS 和 非 LOS 空间 并 不 混在 一 起 。 图 14-14 中 展示 了 这 种 情况 。 

"多 空间 增长 方向 
JELOS 用 区 域 -iTGS 
图 14-14 两 个 回收 空间 共享 同一 个 空闲 区 域 

既然 现在 空闲 区 域 是 LOS 分 配 和 非 LOS 分 配 的 共享 资源 ， 那 它 就 必须 被 互 斥 访问 保护 。 为 
了 避免 过 于 频繁 的 昂贵 原子 操作 ， 非 LOS 分 配 不 直接 在 空闲 区 域 分 配 新 对 象 ， 而 是 每 次 从 空闲 
区 域 分 配 一 个 块 , 然后 只 在 拿 到 的 块 中 分 配 新 对 象 。 LOS 分 配 可 能 需要 从 空闲 区 域 中 分 配 每 个 对 
象 ， 因 为 它 不 知道 要 分 配 多 大 的 块 才 合适 。 

这 种 解决 方案 有 一 个 限制 : 它 只 能 解决 GC 中 有 两 个 分 配 空间 的 情况 。 如 果 有 更 多 分 配 空间 
的 话 ， 它们 不 能 向 着 对 方 的 方向 增长 。 这 种 情况 下 ， 至 少 一 个 分 配 空间 要 有 自己 单独 的 空间 , 不 
与 其 他 空间 共享 同一 个 空闲 区 域 。 

每 当 有 一 个 分 配 空间 满 了 的 时 候 , 就 需要 触发 一 次 回收 。 仍 以 LOS 和 非 LOS HEA Bi, 图 14-15 
中 展示 了 这 种 情况 。 

----> 空间 增长 方向 


JELOS  ------> LOS ~- > 


图 14-15 ”两 个 分 配 空间 有 各 自 独 立 的 空闲 区 域 
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如 果 一 个 空间 触发 了 回收 , 而 另 一 个 空间 还 几乎 没有 填充 , 堆 就 没有 被 充分 利用 。 进一步 说 ， 
这 会 叶 致 更 频繁 的 回收 和 更 低 的 应 用 程序 性 能 。 

这 里 的 关键 问题 是 , 为 什么 一 个 空间 比 男 一 个 空间 消耗 更 快 这 是 因为 一 个 空间 比 男 一 个 空 
间 分 配对 象 更 快 。 也 就 是 说 ， 在 同样 的 时 间 内 ， 一 个 空间 的 空 闪 区 域 消 耗 的 比例 比 男 一 个 更 高 。 

如 果 在 同样 的 时 间 内 ,两 个 空间 分 配 了 本 空间 内 同样 比例 的 空 闪 区 域 , 那么 两 个 空间 可 能 在 
触发 垃圾 回收 的 时 候 都 是 满 的 。 基 于 这 个 观察 结果 ，GC 可 以 动态 监测 不 同 空间 的 分 配 速度 ， 定 
义 为 单位 时 间 内 分 配 的 对 象 大 小 ( 即 字 节 数 / 秒 )， 并 利用 这 个 信息 调整 堆 分 割 。 这 样 在 理想 情况 
下 ， 如 果 LOS 和 非 LOS 的 空 亲 空间 大 小 设置 为 与 它们 各 自 的 分 配 速度 成 比例 ， 那 么 两 个 空间 会 
同时 变 满 。 于 是 分 配给 LOS 的 空闲 区 域 大 小 可 以 通过 以 下 方式 定义 。 

FreeSize,,. = TotalFreeSize*AllocSpeed,,. / (AllōcSpeedps+tAllocSpeed onos) 

分 配 速度 的 计算 可 以 是 很 灵活 的 。 例 如 ， 如 果 空 间 是 平坦 的 〈 即 没有 任何 拣 套 空间 )， 它 可 
以 是 从 上 一 次 回收 之 后 分 配 的 全 部 字 节 , 或 者 前 几 次 回收 的 速度 平均 值 。 根 据 我 们 的 经 验 , 使 用 
上 次 回收 的 分 配 字 节 数 就 足够 好 了 。 


有 时 候 为 了 更 精确 ， 分 配 速度 计算 可 能 与 GC 算法 相关 。 例如， 如 果 一 个 分 配 空间 包含 租 套 
空间 ， 就 像 非 LOS 内 可 以 包含 MOS 和 NOS 那样 ， 那 就 不 能 使 用 某 个 时 间 段 分 配 的 字 节 数 来 计 
算 分 配 速度 。GC 应 该 计算 这 个 仍 套 空间 的 分 配 速 度 ， 也 就 是 整个 非 LOS 空间 ， 而 不 是 任何 柑 套 
在 里 面 的 空间 。 空 闲 区 域 分 割 是 在 非 LOS 级 的 空间 之 间 进 行 的 ， 而 不 是 在 NOS 或 者 MOS 级 。 
这 个 示例 中 , AE LOS 的 分 配 字 节 数 应 该 计算 为 两 次 回收 之 间 ( 即 上 次 回收 之 后 和 这 次 回收 之 前 ) 
的 所 有 对 象 大 小 之 差 。 既 然 非 LOS 级 的 回收 是 主 回收 ,那么 非 LOS 分 配 速度 可 以 这 样 求 近似 : 计 
算 上 次 主 回收 之 后 和 这 次 主 回收 之 前 的 MOS 大 小 之 差 ， 再 除 以 两 次 回收 之 间 的 时 间 。 

这 个 启发 式 策略 可 以 扩展 到 多 个 分 配 空间 的 情况 , 但 是 会 非常 繁复 。 即便 使 用 非常 精巧 的 设 
计 , 也 很 难 充分 利用 堆 , 一 个 更 好 的 解决 方案 是 共享 同一 个 空 闪 区域, 但 是 不 要 求 线性 连续 地 址 。 
连续 地 址 主要 是 为 了 分 配 大 对 象 , 以 及 普通 对 象 的 线程 局 部 跳 增 指针 分 配 。 这 个 策略 对 分 代 回 收 
的 快速 写 屏 障 执行 也 很 有 用 ， 其 中 已 回收 和 未 回收 的 空间 分 别 位 于 边界 的 两 侧 。 

可 以 通过 OS 的 内 存 重 映射 机 制 获得 连续 地 址 ， 这 个 机 制 可 以 把 当前 虚拟 地 址 的 物理 页 面 映 
射 到 男 一 个 指定 的 虚拟 地 址 。 

为 了 这 个 目的 , 可 以 在 两 个 层级 上 管理 堆 。 第 一 级 管理 器 把 堆 分 割 为 块 ， 只 在 块 间 级 别管 理 
内 存 。 也 就 是 说 ， 以 一 个 块 或 者 多 个 连续 块 ( 多 块 ) 为 单位 。 第 二 级 管理 器 在 块 内 级 别 操作 。 堆 
中 的 一 个 空间 不 再 是 连续 地 址 空间 ， 而 是 块 或 者 多 块 的 链表 。 我 们 称 之 为 虚拟 空间 。 当 一 个 空间 
是 块 的 链表 时 , 它 的 地 址 按照 块 的 链接 顺序 排序 。 回 收 和 分 配 在 块 上 进行 。 举 例 来 说 ，LOS 和 非 
LOS 分 块 的 堆 如 图 14-16 所 示 。 
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图 14-16 ”以 块 列表 组 织 的 虚拟 空间 


JE LOS 列表 指向 堆 中 的 第 一 个 普通 对 象 块 ， 然 后 这 个 块 中 有 一 个 指针 指向 下 一 个 普通 对 象 
块 ， 以 此 类 推 。 因 此 ， 很 容易 通过 这 个 虚拟 非 LOS 列表 找到 所 有 普通 块 ， 从 而 形成 虚拟 非 LOS 
空间 。 类 似 地 ， 虚 拟 LOS 列表 指向 第 一 个 大 对 象 ， 然 后 这 个 大 对 象 有 一 个 指针 指向 下 一 大 对 象 ， 
以 此 类 推 。 虚 拟 LOS 列表 和 大 对 象 块 构成 了 了 LOS。 注意， 在 这 个 例子 中 ， 一 个 大 对 象 占据 了 一 
个 或 多 个 块 。 


空闲 池 管 理 堆 中 所 有 的 空闲 块 , 它 实 际 上 是 一 个 由 连续 块 数量 索引 的 链表 的 表 。 空闲 池 中 的 
每 个 链表 管理 所 有 由 某 个 数量 的 连续 块 构成 的 空闲 区 域 。 例 如 ,空闲 池 的 槽 位 1 包含 一 个 指针 ， 
指向 第 一 个 没有 其 他 连续 空闲 块 的 空闲 块 。 空闲 池 的 槽 位 3 包含 一 个 指针 ,指向 一 个 3 个 连续 空 
闲 块 组 成 的 区 域 , 这 个 区 域 包含 一 个 指针 ,指向 下 一 个 包含 3 个 连续 空闲 块 的 区 域 。 所 有 包含 大 
于 32 个 连续 空闲 块 的 空闲 区 域 用 一 个 列表 链接 在 一 起 ， 从 大 于 32 的 槽 位 ( 槽 位 >32 ) 开始 。 使 
用 这 个 设计 ,虚拟 空间 可 以 按照 需要 增长 ,只 有 在 整个 堆 都 被 充分 使 用 的 时 候 才 会 触发 垃圾 回收 。 

要 分 配 普 通 对 象 , 修改 器 从 空闲 池 中 抓 取 一 个 空闲 块 作为 线程 局 部 块 , 然后 在 这 个 块 中 分 配 
对 象 ， 直 到 这 个 块 空间 用 完 。 然 后 修改 带 青 抓 取 为 一 个 空闲 块 。 为 了 确保 普通 对 象 能 快速 分 配 ， 
修改 融 只 从 空闲 池 覃 位 1 或 者 槽 位 >32 开始 分 配 线程 局 部 块 。 它 首先 检查 槽 位 1 是 否 为 空 。 如 果 
不 为 空 的 话 ， 就 从 模 位 1 开始 分 配 ; 和 否则 就 从 最 后 一 个 槽 位 〈 即 槽 位 >32 ) 开始 分 配 。 

在 这 些 情况 中 ,对 每 个 线程 局 部 块 只 需要 一 次 原子 操作 。 当 从 槽 位 1 中 选取 线程 局 部 块 的 时 
候 ， 一 个 原子 操作 就 足以 从 共享 列表 中 抓 取 一 个 节点 。 从 槽 位 >32 中 分 配 线程 局 部 块 并 不 是 移 除 
一 个 区 域 , 修改 器 只 是 简单 地 递减 最 后 一 个 槽 位 列表 中 一 个 区 域 的 块 个 数 ,以 此 安全 地 获得 一 个 
块 。 这 个 递减 操作 应 该 是 原子 的 ， 这 样 它 可 以 确保 线程 安全 的 块 分 配 ， 并 只 需要 一 次 原子 操作 
即 可 。 

如 果 覃 位 1 和 槽 位 >32 都 是 空 的 ， 那 么 修改 吾 从 槽 位 2 开始 向 下 扫描 这 个 表 ， 试 图 从 第 一 个 
非 空 的 槽 位 分 配 一 个 空闲 块 。 这 种 情况 下 ， 修 改 器 需要 取得 这 个 区 域 ， 分 配 一 个 块 ， 然 后 把 剩余 
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部 分 放 入 对 应 的 槽 位 ， 这 需要 两 次 原子 操作 。 


与 普通 对 象 不 同 , 每 个 大 对 象 占有 一 个 或 多 个 块 。 因此 , 修改 器 直接 从 空闲 池 中 分 配 大 对 象 。 
当 出 现 一 个 分 配 请 求 的 时 候 ， 修 改 器 首先 检查 请 求 的 块 个 数 ，block_count。 然 后 它 从 索引 为 
block_count 的 构 位 向 下 搜索 空闲 池 ， 检 查 池 中 是 否 有 可 用 区 域 。 如 果 在 槽 位 block_count 
或 者 槽 位 >32 中 命中 的 话 ， 那 么 只 需要 一 个 原子 操作 来 取得 它 ; 否则 就 需要 两 次 原子 操作 。 


如 果 修 改 顺 找 不 到 需要 的 空闲 区 域 ， 就 应 该 触发 垃圾 回收 。 很 巧妙 的 一 点 是 ,尽管 空闲 区 域 
由 不 同 的 虚拟 空间 共享 , 但 是 这 不 妨碍 不 同 的 虚拟 空间 采用 不 同 的 回收 算法 一 一 不 管 是 移动 式 的 
还 是 非 移动 式 的 ， 分 代 式 的 还 是 非 分 代 式 的 。 移 动 式 GC 可 以 在 虚拟 空间 内 移动 活跃 对 象 。 分 代 
A GC 要 求 记 住所 有 的 跨 代 引用 。 这 可 以 通过 把 写 屏障 修改 为 如 下 代码 来 简单 地 实现 。 


gc_write_barrer(Obj_header* src, Obj_header** slot, Obj_header* dst) 
{ 

*slot = dst; 

Block_header* src_blk = block_of_object (src); 

Block_header* dst_blk = block_of_object (dst); 





if( block_in_nos(src) || block_in_mos(dst) ) 
return; 
gc_add_remset_entry(slot); 
} 


当 堆 中 的 连续 空闲 空间 不 足以 放下 一 个 大 对 象 , 同时 非 连续 空闲 块 的 总 大 小 大 于 这 个 大 对 象 
的 时 候 ，GC 可 以 尝试 压缩 堆 以 留 出 足够 的 连续 空闲 空间 。 对 于 一 个 持 有 活跃 对 象 的 块 ，GC 可 
以 把 块 的 虚拟 地 址 重 映射 到 一 个 新 位 置 ( 虚拟 地 址 )， 而 无 须 实际 复制 块 数据 。 应 该 比较 OS 内 
存 重 映射 的 开销 与 内 存 复制 的 开销 ， 然 后 GC 可 以 选择 开销 较 低 的 方法 。 如 果 虚 拟 地 址 空间 足够 
大 的 话 , 还 有 一 个 解决 方案 是 把 非 连续 空闲 块 重 映射 到 一 个 连续 虚拟 地 址 区 域 。 这 个 解决 方案 不 
需要 复制 块 数据 ， 我 们 将 在 第 15 章 中 讨论 。 


Linux 中 内 存 重 映射 的 应 用 程序 接口 (API ) 是 mremap()。 在 Windows 中 不 像 在 Linux 中 那 
么 方便 ,使 用 的 是 AWE。 可 以 保留 两 个 虚拟 内 存 区 域 ， 然 后 在 某 个 时 刻 把 第 一 个 映射 到 一 个 物 
理 内 存 区 域 , 然后 在 另 一 个 时 刻 把 第 二 个 区 域 映 射 到 同一 个 物理 内 存 区 域 。 或 者 可 以 保留 单个 虚 
拟 内 存 区 域 , 但 是 在 不 同时 刻 把 它 不 同 的 段 映 射 到 同一 个 物理 内 存 区 域 。Windows 中 的 示例 代码 
如 下 所 示 (基于 Microsoft MSDN 的 示例 代码 )。 





BOOL bResult; // 普通 布尔 值 

ULONG_PTR NumberOfPages; // 请 求 的 页 数量 
ULONG_PTR *aPFNs; // 页 信息 ; 持 有 不 透明 数据 
PVOID lpMemReserved1; // AWE window。 虚 拟 地 址 1 
PVOID lpMemReserved2; // AWE window。 虚 拟 地 址 2 
int PFNArraySize; // 为 PEN 数组 请 求 的 内 存 


NumberOfPages = MEMORY_REQUESTED / sysPageSize; 

// 计算 用 户 PEN 数组 的 大 小 

PFNArraySize = NumberOfPages * sizeof (ULONG_PTR) ; 

aPFNs = (ULONG_PTR *)HeapAlloc(GetProcessHeap(), 0, PFNArraySize) ; 
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bResult = AllocateUserPhysicalPages (GetCurrentProcess(), &NumberOfPages, aPFNs) ; 
lpMemReserved = VirtualAlloc(NULL, MEMORY_REQUESTED, MEM_RESERVE | MEM_PHYSICAL, 
PAGE_READWRITE) ; 

lpMemReserved2 = VirtualAlloc(NULL, MEMORY_REQUESTED, MEM_RESERVE | MEM_PHYSICAL, 
PAGE_READWRITE) ; 








// 映射 

bResult = MapUserPhysicalPages(lpMemReservedi, NumberOfPages, aPFNs) ; 

// 解 映射 

bResult = MapUserPhysicalPages(lpMemReserved1, NumberOfPages, NULL); 

// 重 映射 

bResult = MapUserPhysicalPages (lpMemReserved2, NumberOfPages, aPFNs); 

// 释放 物理 页 面 

bResult = FreeUserPhysicalPages (GetCurrentProcess(), &NumberOfPages, aPFNs); 
// 释放 虚拟 内 存 


bResult = VirtualFree(lpMemReservedl1, 0, MEM_RELEASE) ; 
bResult = VirtualFree(lpMemReserved2, 0, MEM_RELEASE) ; 
// 释放 aPFNs 数组 

bResult = HeapFree(GetProcessHeap(), 0, aPFNs); 


在 使 用 Windows AWE 之 前 ， 应 用 程序 的 用 户 账 户 需要 得 到 “锁定 内 存 中 页 面 ”的 权限 。 
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除了 算法 设计 ， 还 有 很 多 其 他 优化 有 助 于 提高 垃圾 回收 吞吐 量 。 比 如 ，VM 中 常用 大 页 面 来 
提高 TLB 命中 率 。 它 请 求 OS 以 大 于 4KB 的 页 面 大 小 来 分 配 内 存 。 根据 OS 规定 的 不 同 , 大 页 面 
大 小 可 以 从 64KB 到 4MB 不 等 ,其 至 还 能 更 大 ,这 有 效 地 在 VM 分 配 同样 大 小 内 存 时 减少 了 TLB 
条 目 数量 。 

预 取 是 加 速 垃圾 回收 的 另 一 个 常用 技术 , 可 以 降低 缓存 未 命中 率 。 预 取 可 以 显 式 或 隐 式 实现 。 
显 式 预 取 意 味 着 单纯 为 了 效率 而 非 功能 性 搬入 的 指令 。 这 个 指令 可 能 是 硬件 专门 的 预 取 指令 , 也 
可 能 是 内 存 访问 指令 ， 可 以 有 效 加 载 要 访问 的 内 存 数 据 到 缓存 。 隐 式 预 取 不 插入 任何 专门 指令 ， 
而 是 依赖 于 GC 代码 内 存 访 问 模 式 来 加 载 数据 到 缓存 ， 以 供 后 续 使 用 。 换 句 话 说 ， 隐 式 预 取 试 图 
发 挥 GC 算法 的 数据 局 部 性 。 

数据 预 取 的 一 个 例子 是 在 追踪 算法 设计 中 。 当 回收 器 遍历 堆 来 标记 可 达 对 象 时 , 它 需 要 访问 
活跃 对 象 数据 。 对 一 个 活跃 对 象 的 第 一 次 ( 由 加 载 指令 通过 微 处 理 器 流水 线 ) 接触 通常 是 加 载 对 
象 头 ， 并 检查 它 是 否 已 被 标记 。 如 果 活 跃 对 象 还 没有 在 缓存 中 ( 或 者 说 是 “新 鲜 ” 的 )， 微 处 理 
器 需要 加 载 数据 到 缓存 中 。 在 我 们 的 研究 中 , 第 一 次 接触 可 能 导致 了 追踪 处 理 中 一 半 以 上 的 缓存 
未 命中 。 如 何在 实际 访问 新 鲜 对 象 之 前 预 取 新 鲜 对 象 到 缓存 中 是 一 个 有 趣 的 问题 。 

对 象 邻接 图 可 以 深度 优先 遍历 或 者 广度 优先 遍历 , 也 可 以 使 用 混合 顺序 遍历 。 不 同 顺序 的 局 
部 性 依赖 于 应 用 程序 特性 .通常 , 对象 遍历 顺序 越 匹配 堆 布局 顺序 ( 这 大 体 上 也 是 对 象 分 配 顺 序 )， 
局 部 性 收益 就 越 好 。 研究 表明 ， 对 于 一 般 应 用 程序 来 说 , 深度 优先 遍历 顺序 可 能 优势 最 大 。 它 反 
映 了 这 样 一 个 事实 , 就 是 多 数 应 用 程序 分 配对 象 的 顺序 与 对 象 深度 优先 邻接 的 顺序 相同 。 当 回收 
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需 把 一 个 活跃 对 象 的 数据 加 载 到 缓存 用 于 标记 和 扫描 时 , 邻接 对 象 通常 就 是 下 一 个 要 标记 和 扫描 
的 对 象 , 它 的 数据 现在 已 经 与 当前 对 象 一 起 加 载 到 了 缓存 中 。 这 个 局 部 性 收益 可 以 通过 隐 式 预 取 
获得 。 显 式 预 取 也 可 以 。 例 如 , 回收 器 可 以 使 用 硬件 预 取 指令 来 加 载 标记 栈 中 的 下 一 个 对 象 引 用 ， 
然后 加 载 它 引用 的 对 象 数据 。 

注意 ， 对 象 分 配 性 能 也 很 重要 ， 有 时 候 甚至 更 重要 。GC 优化 永远 不 应 该 忽略 对 象 分 配 。 例 
如 , 预 取 技 术 也 可 以 用 于 对 象 分 配 , 这 样 当 一 个 新 对 象 被 分 配 之 后 , 它 的 数据 就 已 经 在 缓存 中 了 ， 
之 后 修改 器 访问 这 个 对 象 就 不 会 导致 大 量 缓存 未 命中 。 


1558 针对 可 扩展 性 的 GC 优化 





第 14 章 中 讨论 的 高 吞吐 量 垃圾 回收 (GC) 算法 可 以 在 单 核 或 多 核 平台 上 运行 。 理 想 的 情况 
E, 与 在 单 核 平台 上 运行 相 比 , 一 个 设计 方案 在 双核 平台 上 运行 的 否 吐 量 是 它 的 两 倍 ， 也 就 是 具 
备 线性 扩展 性 。 这 意味 着 ,假定 所 有 其 他 因素 不 变 ， 在 N 核 平 台 上 的 否 吐 量 是 单 核 平 台 上 的 NM 
吝 。 它 可 以 表示 为 下 面 的 等 式 ， 其 中 否 吐 量 用 核 数 的 函数 表示 。 

Throughput (N) = N*Throughput (1) // 线性 扩展 性 

如 果 GC 算法 不 变 , 一 次 回收 使 用 的 核 数 应 该 不 影响 这 次 回收 释放 的 内 存 大 小 。 既 然 有 

Throughput = Size_freed_memory / Time_collection 
那么 上 面 的 等 式 就 变 为 如 下 所 示 : 

Time_collection(N) = (1/N)*Time_collection(1) // 线性 扩展 性 

要 得 到 线性 可 扩展 性 , 这 个 算法 必须 是 完全 并 行 的 。 也 就 是 说 操作 可 以 被 负载 均衡 地 分 配给 
不 同 的 核 , 并 且 它 们 也 不 浪费 时 间 在 彼此 的 同步 上 。 这 在 一 个 回收 算法 的 某 个 阶段 是 可 以 实现 的 ， 
但 是 要 在 整个 回收 过 程 中 实现 是 非常 有 难度 的 。 本 章 介 绍 并 行 回收 算法 的 设计 。 负载 均衡 和 同步 
是 贯穿 本 章 的 两 个 不 变 的 主题 。 

并 行 回收 由 多 个 回收 顷 执 行 。 当 一 次 回收 启动 后 , 在 多 核 平 台 上 GC 可 能 决定 启动 多 个 回收 
融 。 在 一 个 停止 节 界 回收 中 ， 回 收 顷 的 数量 通常 与 虚拟 机 CVM ) 可 用 的 核 数 相同 。 回 收 器 的 最 
优 数量 依赖 于 系统 调 优 。 

所 有 回收 算法 都 从 根 集 枚 举 阶段 开始 。 可 以 由 回收 器 枚 举 所 有 修改 器 的 根 集 , 或 者 修改 器 也 
可 以 枚 举 自 己 的 根 集 , 并 向 回收 器 报告 。 既 然 这 个 阶段 涉及 修改 器 暂停 ,是 无 法 避免 目 开销 很 高 
的 操作 ， 而 根 集 枚 举 则 通常 比较 快 , 那么 这 个 阶段 的 并 行 化 不 是 关键 的 ， 而 应 该 努力 并 行 化 这 个 
阶段 之 后 的 任务 。 


15.1 回收 阶段 


如 果 回 收 需 数量 很 多 ,所 有 这 些 回 收 占 之 间 在 各 个 阶段 的 屏障 同步 (barrier synchronization ) 
可 能 很 昂贵 , 所 以 应 该 尽 可 能 避免 。 出 于 这 种 考虑 ,一 个 回收 算法 中 的 屏障 数量 是 设计 中 需要 考 
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虑 的 一 个 非常 重要 的 因素 。 

前 文中 已 经 讨论 过 ,活跃 对 象 标记 是 根 集 枚 举 之 后 的 第 二 个 阶段 。 

追踪 复制 回收 可 以 在 对 象 图 遍历 的 同时 执行 对 象 转发 , 所 以 它 不 需要 标记 阶段 和 移动 阶段 之 
间 的 屏障 同步 。 

标记 清除 回收 有 两 个 步骤 : 活跃 对 象 标 记 和 死亡 对 象 清除 。 它 必须 在 这 两 个 步 又 之 间 有 一 个 
屏障 ， 因 为 回收 器 只 有 在 追踪 阶段 完成 后 才 知 道 哪 些 是 死亡 对 象 。 在 实际 实现 中 , 可 以 把 清除 阶 
段 推迟 到 分 配 时 。 

由 于 标记 压缩 算法 就 地 移动 式 回收 的 本 性 , 不 用 屏障 执行 起 来 是 有 挑战 性 的 。 对象 图 遍历 是 
按照 对 象 邻接 的 顺序 进行 ,而 压缩 通常 是 按照 对 象 地 址 的 顺序 进行 。 它 必须 在 所 有 活跃 对 象 都 标 
记 后 才能 压缩 堆 ， 以 避免 被 移动 的 对 象 覆 盖 其 他 活跃 对 象 。 


除了 对 回收 算法 阶段 的 考虑 ， 出 于 其 他 原因 ，GC 也 可 能 必须 包含 屏障 。 当 GC 有 不 止 一 个 
回收 空间 的 时 候 ， 回 收 不 同 空间 的 回收 器 可 能 必须 同步 。 终 结 、 引 用 对 象 处 理 、 类 钊 载 等 操作 ， 
通常 需要 独立 的 阶段 ， 所 以 也 需要 屏障 。 尽管 这 些 阶 段 有 屏障 , 但 如 果 VM 实现 中 这 些 阶 段 执行 
可 以 与 修改 器 执行 并 发 ， 那 么 屏障 的 开销 就 不 一 定 是 严重 的 问题 。 
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对 象 图 遍历 通常 是 回收 中 最 耗 时 的 阶段 。 它 可 以 单纯 标记 可 达 对 象 , 也 可 以 包含 把 标记 对 象 
复制 到 空闲 空间 这 个 动作 。 在 遍历 阶段 ， 通 常会 使 用 一 个 辅助 数据 结构 标记 栈 | mark-stack， 或 
者 标记 队列 ( mark-queue )]， 不 过 不 是 强制 性 的 。 这 个 栈 初 始 化 填充 为 根 引用 〈 或 者 包含 根 引 用 
的 槽 位 )。 回 收费 从 栈 中 弹出 一 个 引用 ， 标 记 被 引用 的 对 象 ， 然 后 扫描 它 包含 引用 的 字段 。 对 象 
扫描 过 程 中 发 现 的 每 个 未 标记 对 象 的 引用 (或 者 包含 这 个 引用 的 槽 位 ) 被 压 入 栈 中 。 当 标记 栈 空 
的 时 候 ， 所 有 的 可 达 对 象 就 都 被 标记 过 了 。 

整个 追踪 过 程 可 以 被 看 作 在 标记 栈 元 素 上 的 和 迭代。 由 于 其 完美 的 并 行 属性 , 乍 一 看 并 行 化 似 
乎 很 容易 。 一 个 直观 的 并 行 化 方法 就 是 可 以 让 回收 器 以 一 种 同步 方式 共享 标记 栈 。 也 就 是 说 , 每 
个 回收 器 从 栈 中 弹出 一 个 元 素 , 标记 并 扫描 , 然后 把 未 标记 可 达 对 象 压 栈 。 栈 访问 〈 出 栈 与 压 栈 ) 
是 同步 的 ,因此 它们 是 回收 器 之 间 的 原子 操作 。 这 个 解决 方案 的 问题 是 ， 对 标记 栈 密集 的 同步 访 
问 意味 着 极 高 的 开销 和 极 低 的 可 扩展 性 。 换 名 话说 ,任务 共享 的 粒度 太 细 ,到 了 单个 对 象 引 用 处 
理 。 当 回收 需 的 数量 很 大 的 时 候 ， 对 共享 标记 栈 的 访问 可 能 会 成 为 性 能 瓶颈 。 

要 避免 过 高 的 同步 开销 , 很 自然 会 想到 在 回收 器 间 分 割 追踪 任务 。 一 个 解决 方案 是 把 初始 根 
集 平均 分 制 到 回收 器 , 然后 每 个 回收 融 可 以 大 致 独立 操作 自己 的 标记 栈 , 从 分 配 到 的 根 引 用 开始 。 
在 整个 对 象 图 遍历 过 程 中 , 回收 器 不 会 交换 任务 。 这 个 解决 方案 的 问题 是 , 对 象 图 结构 是 任意 的 ， 
所 以 一 开始 的 根 引 用 平均 分 配 不 一 定 让 追踪 任务 在 回收 器 中 间 也 是 平均 分 配 的 。 负 载 均衡 是 一 个 
问题 。 应 该 有 在 回收 顷 之 间 动 态 共 享 或 交换 追踪 任务 的 方法 。 
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15.2.1 任务 共享 


一 种 共享 追踪 任务 的 方法 是 “任务 共享 "”， 其 中 追踪 任务 分 组 为 块 ， 回 收 需 以 块 为 粒度 共享 
任务 。 一 个 追踪 任务 用 一 个 待 扫描 对 象 表 示 ， 一 个 块 有 多 个 对 象 引 用 (或 者 引用 槽 位 )。 图 15-1 
展示 了 这 个 算法 。 

回收 器 1 
空闲 池 = brick, 任务 池 





图 15-1 回收 需 间 追踪 任务 的 任务 共享 


O 步 又 1。 一 开始 ， 所 有 的 根 引 用 被 放 和 人 大 小 相等 的 块 ( 任务 块 ) 中 ,， 所 有 的 任务 块 又 被 放 
到 一 个 任务 池 中 ， 这 个 任务 池 是 一 个 全 局 数据 结构 。 
口 步骤 2。 每 个 回收 器 通过 对 池 的 同步 访问 ， 从 任务 池 中 抓 取 一 个 任务 块 。 
口 步 又 3。 每 个 回收 器 使 用 这 个 任务 块 作为 一 个 标记 栈 ， 像 在 顺序 追踪 处 理 中 一 样 处 理 它 。 
口 步骤 4。 如 果 标 记 栈 满 了 ， 回 收 器 把 新 任务 压 人 一 个 新 的 任务 栈 ， 在 新 任务 栈 上 继续 追踪 
任务 。 
口 步 桑 5。 回收 天 把 已 满 的 旧 任 务 栈 放 回 任务 池 。 
口 步骤 6。 当 任务 栈 空 了 的 时 候 ， 回 收 器 把 它 放 回 到 一 个 空闲 块 池 中 ， 然 后 从 任务 池 中 抓 取 
一 个 任务 块 ， 直 到 任务 池 空 
这 个 解决 方案 同时 解决 了 同步 粒度 和 负载 均衡 问题 。 但 这 仍 不 是 一 个 完美 的 解决 方案 , 因为 
有 时 候 可 能 出 现 这 种 情况 : 一 个 回收 器 长 时 间 忙 于 处 理 它 的 局 部 标记 栈 ,， 而 另 一 个 回收 器 还 在 空 
闲 中 等 待 某 个 回收 需 向 任务 池 中 放 入 任务 块 。 另 外 ， 池 访问 的 同步 也 是 一 个 问题 。 


15.2.2 ”工作 偷 取 


要 避免 标记 栈 任 务 不 平衡 的 问题 ,“ 工 作 偷 取 ” 可 以 作为 一 个 解决 方案 。 其 思路 是 空闲 回收 
器 从 忙碌 回收 器 的 标记 栈 中 偷 取 一 些 任 务 。 空闲 回收 器 不 需要 等 待 一 个 忙碌 的 回收 器 因 其 标记 栈 
溢出 而 放 回 的 块 。 图 15-2 展示 了 这 个 操作 。 
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图 15-2 回收 器 中 追踪 任务 的 工作 偷 取 


口 步骤 1。 每 个 回收 器 有 一 个 线程 局 部 标记 栈 。 一 开始 ， 所 有 回收 器 平均 分 割 所 有 根 引用 ， 
并 压 入 各自 的 标记 栈 。 每 个 回收 器 就 像 在 顺序 追踪 过 程 中 一 样 在 自己 的 标记 栈 上 操作 。 
O 步 又 2。 当 一 个 回收 融 处 理 完 了 自己 的 标记 栈 ， 就 从 另 一 个 回收 器 的 标记 栈 中 偷 取 最 后 一 
个 项 目 。 标 记 栈 的 最 后 一 项 是 全 局 可 访问 的 ， 所 以 对 它们 的 访问 需要 在 回收 器 间 同 步 。 
如 有 果 最 后 一 项 被 偷 走 ， 那 么 指向 最 后 一 项 的 指针 被 修改 为 指向 倒数 第 二 项 。 
口 步骤 3。 如 果 一 个 标记 栈 已 满 ， 回 收 避 为 溢出 的 对 象 引 用 创建 一 个 新 的 标记 栈 ， 在 新 标记 
工作 偷 取 本 质 上 就 是 把 每 个 标记 栈 的 最 后 一 项 作为 所 有 回收 器 共享 的 任务 池 。 在 实际 的 实现 
P, 最 后 一 项 也 可 以 是 最 后 几 项 ， 或 者 剩余 栈 项 目的 一 半 。 栈 可 以 实现 为 双 端 队列 。 工 作 偷 取 可 
以 与 任务 共享 相 结合 ， 这 样 回收 器 只 有 在 任务 池 为 空 的 时 候 才 偷 取 任务 。 


工作 偷 取 能 够 确保 的 是 , 只 要 有 足够 的 任务 , 这 些 任 务 就 会 被 分 配给 多 个 回收 器 以 获得 负载 
均衡 。 但 是 这 个 解决 方案 仍然 需要 同步 访问 最 后 一 项 。 另 外 一 个 解决 方案 “任务 推送 ”有 助 于 完 
全 消除 同步 。 


15.2.3 ”任务 推送 


任务 推送 的 思路 是 使 用 一 个 单独 的 任务 队列 数据 结构 , 用 于 回收 器 间 的 任务 交换 。 这 个 队列 
就 像 是 任务 共享 中 的 任务 池 ， 回 收 咒 主动 把 它 的 多 余 任 务 放 一 些 到 其 中 。 共 享 的 任务 ， 就 像 在 工 
作 偷 取 中 一 样 ， 由 回收 器 从 它 自 己 的 标记 栈 的 最 后 一 项 取出 并 放 入 任务 队列 。 


图 15-3 展示 了 这 个 思 
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回收 器 1 
CO) 标记 楼 任务 队列 


OLLE et 


图 15-3 ”使 用 追踪 任务 队列 实现 回收 需 间 任务 推送 


口 步骤 1。 每 个 回收 占有 一 个 线程 局 部 标记 栈 。 一 开始 ， 根 引用 被 平均 分 配给 所 有 回收 需 ， 
并 被 奈 入 它们 各 自 的 标记 栈 。 每 个 回收 器 像 顺 序 追 踪 处 理 一 样 在 它们 的 标记 栈 中 操作 。 
O 步骤 2。 当 回收 器 从 它 的 标记 栈 中 弹出 一 个 任务 的 时 候 ， 它 检查 任务 队列 是 否 为 空 。 如 果 
是 的 话 ， 它 从 自己 的 任务 栈 底 拿 出 一 个 任务 并 压 人 任务 队列 。 当 回收 器 的 标记 栈 空 了 的 
时 候 ， 它 检查 任务 队列 中 是 否 有 任务 。 如 果 有 的 话 ， 它 出 队 一 个 任务 ， 把 它 压 入 自己 的 

标记 栈 并 继续 。 

O 步骤 3。 如 果 标 记 栈 满 了 的 话 ， 回 收 需 为 溢出 的 对 象 引用 创建 一 个 新 的 标记 栈 ， 并 在 这 个 

新 的 标记 栈 上 继续 操作 。 

任务 推送 是 任务 共享 和 工作 偷 取 的 一 个 混合 方案 。 与 任务 共享 的 区 别 是 , 任务 推送 只 把 一 个 
任务 放 入 任务 队列 , 而 不 是 把 一 个 块 放 入 任务 池 。 由 于 标记 栈 中 的 最 后 一 项 通常 是 要 遍历 的 一 个 
子 树 的 根 节点 , 一 个 任务 不 一 定 是 一 个 小 任务 。 与 工作 偷 取 的 区 别 是 , 任务 推送 单独 使 用 一 个 数 
据 结构 用 于 任务 交换 ， 并 且 只 有 对 任务 队列 的 访问 需要 同步 ， 这 使 得 这 个 算法 更 容易 实现 。 

一 个 特殊 队列 设计 可 以 消除 队列 访问 的 同步 ， 称 为 单 生产 者 、 单 消费 者 ( single-producer， 
single-consumer，SPSC ) 队列 。SPSC 可 以 组 成 多 生产 者 、 多 消费 者 ( MPMC ) 队列 ， 方 法 是 每 
一 对 生产 者 和 消费 者 使 用 一 个 SPSC 队列 。 

在 任务 推送 中 ， 生 产 回收 絮 i 和 消费 回收 器 j 使 用 的 SPSC 队列 用 queueli, 7 表示。 回收 釉 i 
通过 入 队 任务 到 queue[i, 四 向 回收 右 j 发 送 它 的 闲置 任务 。 然 后 回收 絮 j 从 这 个 队列 中 出 队 任务 。 
为 了 N 个 回收 带 彼 此 之 间 交 换 任务 ， 需 要 一 个 (N — 1)*(N — 1) 的 SPSC 队列 和 矩阵 组 成 这 个 MPMC 
队列 。 任 务 推送 使 用 这 个 MPMC 队列 作为 任务 队列 。 

如 果 SPSC 队列 可 以 不 需要 同步 ,那么 MPMC 队 也 可 以 不 需要 同步 。SPSC 队列 利用 了 字 对 





15.2 “并行 对 象 图 遍历 237 








齐 内 存 访问 内 建 的 原子 性 ， 这 是 所 有 已 知 当代 处 理 器 都 支持 的 。MPMC 队列 中 的 所 有 项 目 都 需 
要 字 对 齐 , 这 样 可 以 确保 它们 的 加 载 和 存储 是 原子 的 。 因 为 对 象 引 用 大 小 为 字 长 ， 所 以 这 个 需求 
是 很 容易 满足 的 。 

SPSC 队列 使 用 值 NULL (或 者 任何 不 是 有 效 任 务 标识 符 的 值 ， 即 对 象 引 用 的 值 ) 来 指示 一 个 
空 表 项 ,任何 非 NULL 项 目 持 有 一 个 任务 。 一 个 项 目 出 队 以 后 , 消费 者 向 这 个 项 目 存 人 一 个 NULL。 
在 生产 者 入 队 之 前 ， 它 会 检查 当前 项 目 值 是 否 为 NULL。 这 个 队列 有 一 个 队 头 指针 和 一 个 队 尾 指 
针 ， 它 们 总 是 分 别 指向 第 一 个 填充 项 和 第 一 个 未 填充 项 ， 也 就 是 队列 两 端的 任务 。 图 15-4 中 展 
示 了 使 用 MPMC 队列 的 任务 推送 。 


回收 给 
标记 栈 " 任务 队列 

















图 15-4 使 用 多 生产 者 、 多 消费 者 ( MPMC ) 追踪 任务 队列 在 回收 器 之 间 的 任务 推送 


口 步骤 1。 每 个 回收 器 有 一 个 线程 局 部 标记 栈 。 一 开始 ， 根 引用 被 平均 分 配给 所 有 回收 需 ， 
并 被 压 人 它们 各 自 的 标记 栈 。 每 个 回收 器 像 顺 序 追 踪 处 理 一 样 在 它 的 标记 栈 中 操作 。 

O 步骤 2。 当 回收 器 x 从 它 的 标记 栈 中 弹出 一 个 对 象 后 ， 它 会 检查 它 的 输出 队列 queuefx, *] 
中 是 否 有 空位 。 如 果 有 的 话 ， 它 从 标记 栈 底 拿 出 一 个 任务 ， 把 它 压 和 人 有 空位 的 输出 队列 。 

O 步骤 3。 妆 回收 费 y 的 标记 栈 空 了 的 时 候 ， 它 检查 自己 的 所 有 输入 队列 queue[*, y] 是 否 有 
任务 。 如 果 有 的 话 ， 它 出 队 这 个 任务 ， 把 它 压 入 自己 的 标记 栈 并 继续 。 

口 步骤 4。 如 果 一 个 标记 栈 已 满 ， 回 收 絮 为 溢出 的 对 象 引用 创建 一 个 新 的 标记 栈 ， 并 在 新 标 
记 栈 上 继续 操作 。 

在 现实 中 ， 每 个 SPSC 队列 的 大 小 只 需 一 两 个 项 目 即 可 。 更 长 的 队列 不 会 带 来 更 好 的 性 能 ， 

因为 这 意味 着 回收 器 放 和 人 任务 的 速度 比 任务 消耗 的 速度 更 快 。 
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任务 推送 算法 需要 有 正确 的 设计 来 保证 处 理 过 程 正确 终止 。 一 个 回收 融 无 法 局 部 地 确定 它 上 自 
己 是 否 应 该 结束 对 象 追 踪 阶 段 , 一 个 回收 避 的 空 标记 栈 和 空 的 输入 队列 不 一 定 意味 着 这 个 回收 带 
没有 更 多 的 任务 了 ,内 为 其 他 线程 可 能 很 快 就 会 传人 新 任务 , 感 兴 趣 的 读者 可 以 参考 作者 关于 “ 任 
务 推送 ”的 论文 。 


15.3 并行 对 象 标记 


在 并 行 回收 中 ,可 能 有 多 个 回收 器 同时 到 达 同 一 个 对 象 并 试图 标记 它 的 情况 。 有 些 GC 使 用 
标记 表 ， 其 中 一 个 位 映射 到 内 存 中 的 一 个 字 。 如 果 一 个 对 象 可 达 , 标记 表 中 对 应 于 这 个 对 象 的 第 
一 个 字 的 相应 位 被 置 起 ， 表 示 这 个 对 象 是 活跃 的 。 如 果 字 宽度 为 32 位， 那么 1/32 的 堆 大 小 用 来 
标记 位 表 ， 这 并 不 是 很 大 的 开销 。 问 题 是 ， 当 一 个 字 中 有 不 止 一 位 对 应 到 相应 的 活路 对象， 如 来 
这 个 处 理 器 上 的 位 设置 默认 不 是 原子 操作 , 那么 要 并 发 设置 它们 可 能 需要 原子 操作 , 而 这 在 当代 
处 理 器 上 是 比较 常见 的 。 原 子 操作 是 昂贵 的 。 

如 果 在 处 理 器 上 字 节 操作 是 自动 原子 化 的 , 一 个 解决 方案 是 使 用 字 节 大 小 的 标志 来 表示 对 象 
活性 。 不 太 可 能 用 一 个 字 节 映射 到 一 个 字 ， 因 为 这 样 做 的 话 ， 空 间 开 销 太 高 。GC 可 以 把 一 个 字 
节 映 射 到 对 象 对 齐 单位 。 例 如 ， 如 果 GC 可 以 选择 把 对 象 对 齐 到 16 字 节 地 址 边界 ， 那 么 1 字 市 
可 以 映射 到 16 字 节 ， 并 且 两 个 对 象 不 可 能 映射 到 同一 个 字 节 。 使 用 这 个 解决 方案 ， 就 消除 了 原 
子 操作 开销 ， 而 空间 开销 是 不 能 忽略 不 计 的 。 

为 了 降低 空间 开销 ， 可 以 把 这 个 标志 映射 到 更 大 的 一 段 内 存 ， 比 如 256 字 节 。 当 这 个 标志 被 
EDERREK, 映射 区 域 的 所 有 对 象 都 被 认为 是 活路 的 ; 否则 ,它们 都 是 死亡 的 。 当 回收 带 裔 历 堆 
的 时 候 ， 只 要 到 达 映 射 区 域 中 的 任何 一 个 对 象 ， 这 个 标志 就 被 置 起 。 这 个 设计 不 需要 原子 操作 ， 
空间 开销 也 比较 小 ,但 是 它 不 能 给 出 标记 区 域 中 哪个 确切 的 对 象 是 活跃 的 , 因此 保留 了 漂浮 垃圾 。 
它 以 漂浮 垃圾 为 代价 ， 换 取 更 小 的 标记 表 。 

标记 表 中 的 字 节 和 堆 中 的 字 是 相互 映射 的 。 也 就 是 说 ，GC 可 以 通过 字 节 标志 找到 映射 的 对 
象 ， 反 之 亦 然 。 一 种 实现 方法 是 分 配 一 大 块 内 存 用 作 标 记 表 ， 有 映射 到 整个 堆 。 因 为 标记 表 的 基地 
址 和 推 的 基地 址 是 已 知 的 , 所 以 可 以 很 容易 地 计算 出 一 个 对 象 和 它 的 标志 的 偏 移 映 财 。 假定 1 F 
节 标 志 映 射 到 16 字 节 内 存 ， 那 么 有 

offset_flag = offset_object << 4; 


addr_flag = addr_table_base + (addr_object - addr_heap_base) >> 4; 
addr_object = addr_heap_base + (addr_flag - addr_table_base) << 4; 


这 里 addr_object 是 一 个 对 象 的 地 址 ，addr_flag 是 映射 的 已 标记 标志 的 地 址 ， 

为 标记 表 预 先 分 配 一 大 段 内 存 不 一 定 是 最 好 的 解决 方案 , 因为 VM 可 能 在 它 的 整个 实例 生存 
期 内 永远 不 会 使 用 到 分 配 的 堆 大 小 。 更 重要 的 是 , 堆 空 间 可 能 不 是 连续 的 。 建 立 标记 表 段 来 映射 
到 堆 段 并 不 方便 ,一 个 解决 方案 是 把 一 个 堆 区 域 的 标记 表 和 这 个 区 域 放 到 一 起 , 标记 表 只 在 堆 区 
域 分 配 了 之 后 才 分 配 ， 然 后 标记 表 和 它 映射 的 堆 区 域 总 是 有 同样 的 基地 址 。 
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为 了 更 方便 , 堆 区 域 可 以 按 固定 的 块 大 小 来 分 配 , 大 小 为 2 AE, 块 基地 址 与 大 小 边界 对 齐 。 
通过 这 种 方法 ， 可 以 从 堆 区 域 中 任意 地 址 推导 出 这 个 区 域 的 基地 址 。 假 定 标记 表 在 每 个 块头 
( block header ) 占据 大 小 为 TABLE_SIZE 的 空间 ， 那 么 有 

block_base = addr_object & ~(BLOCK_SIZE - 1); 

addr_flag = block_base + (addr_object - block_base - TABLE_SIZE) >> 4; 


block_base = addr_flag & ~(BLOCK_SIZE - 1); 
addr_object = block_base + TABLE_SIZE + (addr_flag - block_base) << 4; 


把 标记 表 放 在 每 个 块 的 块头 , 通常 要 优 于 把 它 放 在 用 于 整个 堆 的 单独 一 段 内 存 中 。 根据 需要 ， 标 
记 表 仍然 可 以 使 用 位 、 字 节 或 者 其 他 大 小 的 标志 ,映射 到 块 体 中 的 字 或 者 其 他 大 小 的 单位 。 追踪 
算法 可 以 设计 为 一 个 块 只 被 同一 个 回收 器 遍历 , 这 样 块头 中 的 标记 表 只 被 一 个 修改 器 修改 , 因此 
就 不 需要 原子 操作 。 

标记 表 有 一 个 优点 就 是 活跃 对 象 的 标志 放 在 一 起 , 回收 器 很 容易 通过 扫描 标记 表 找 到 堆 中 所 
有 活跃 对 象 。 在 标记 清除 回收 中 ， 这 对 清除 死亡 对 象 来 说 也 是 很 有 用 的 。 

对 退 踊 复制 式 GC 来 说 ,标记 表 就 不 是 那么 有 用 了 ,因为 回收 器 在 同一 趟 中 标记 并 同时 转发 
活跃 对 象 , 所 以 不 需要 通过 扫描 标记 表 来 找到 活跃 对 象 。 这 种 情况 下 ， 可 以 把 标记 表 重 用 为 持 有 
转发 地 址 的 目标 表 ， 一 个 活跃 对 象 映 射 到 一 个 转发 地 址 。 或 者 追踪 复制 式 GC 可 以 把 活性 标志 直 
接 放 到 对 象 头 中 ， 这 样 就 完全 不 使 用 额外 的 标记 表 。 





15.4 ”并行 压缩 


压缩 是 指 通过 就 地 移动 式 回收 , 从 被 完全 分 配 的 堆 中 挤 压 出 空闲 空间 。 它 能 产生 大 段 连 续 空 
闲 空 间 , 这 样 就 可 以 通过 跳 增 指针 来 分 配对 象 , 也 可 以 成 功 容纳 大 对 象 。 存活 对 象 被 压缩 到 一 起 ， 
也 提高 了 访问 局 部 性 。 





15.4.1 并行 LISP2 压缩 器 


理想 的 压缩 回收 是 “滑动 压缩 ”>， 它 把 活跃 对 象 按 原来 的 顺序 移动 到 堆 的 一 端 。 顺 序 LISP2 
压缩 器 (compactor ) 以 一 种 直观 的 方式 实现 了 滑动 压缩 回收 。 图 15-5 展示 了 LISP2 压缩 器 的 工 
作 步 又 。 
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图 15-5 顺序 LISP2 压缩 器 


步骤 解释 如 下 。 
O 步骤 1， 活 跃 对 象 标 记 。 回 收费 通过 从 根 集 追 踪 遍 历 堆 来 标记 所 有 可 达 对 象 。 
O 步骤 2， 对 象 重 定位 。 回 收 需 从 头 到 尾 顺 序 扫描 堆 ， 为 堆 中 所 有 活跃 对 象 计算 目标 地 址 。 
一 个 活跃 对 象 的 目标 地 址 是 它 压缩 后 的 新 地 址 。 当 为 一 THN TA 
回收 需 需 要 知道 堆 中 位 于 它 之 前 的 其 他 对 象 的 新 地 址 ， 以 维护 滑动 压缩 性 质 。 每 个 活跃 
对 象 的 目标 地 址 保存 在 它 的 对 象 关 中， 或 者 放 在 一 个 单独 的 空间 中 。 
O 步 又 3， 引 用 修正 。 回 收 器 遍历 堆 ， 并 将 堆 中 所 有 对 象 引 用 重 定位 到 被 引用 对 象 的 目标 
地 址 。 eee 是 按 从 头 到 尾 顺序 的 堆 扫 描 ， 也 可 以 是 跟踪 对 象 邻 接 图 的 堆 追 踪 。 在 某 
些 设计 中 ， 这 个 步骤 被 称 为 重 映射 ,或 者 引用 更 新 。 
O 步骤 4， iia 回收 需 按 照 从 堆 头 到 堆 尾 的 顺序 依次 移动 活跃 对 象 。 一 个 对 象 被 移动 
到 它 的 新 位 置 的 时 候 ， 新 位 置 上 原来 的 活跃 对 象 已 经 事先 移 走 了 ， 因 此 这 个 过 程 中 不 会 
有 数据 丢失 。 
很 容易 看 到 ， 步骤 1 和 步骤 3 可 以 像 在 并 行 堆 追 踪 中 那样 用 多 个 回收 器 执行 。 步 又 2 和 步骤 
4 有 顺序 要 求 ， 需 要 额外 的 设计 。 步 又 2 和 步骤 4 的 概念 顺序 算法 如 下 所 示 。 其 中 显然 存在 基于 
堆 顺 序 的 循环 承载 依赖 性 ( loop-carried dependence ) 


IIR 2: 


new_addr = heap_start; 
next_obj = next_live_object_from(new_address) ; 
while (next_obj != NULL) { 
target_address(next_obj) = new_addr; 
inc_size = object_size(next_obj); 
new_addr += inc_size; 
next_obj = next_live_object_from(next_obj + inc_size); 
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步骤 4; 


next_obj = next_live_object_from(heap_start) ; 
target_addr = target_address (next_obj); 
while (next_obj != NULL) { 
object_copy (target_addr, next_obj); 
inc_size = object_size(next_obj); 
next_obj = next_live_object_from(next_obj + inc_size); 
target_addr = target_address(next_obj); 
} 


并 行 化 LISP2 压缩 器 的 一 个 简单 解决 方案 是 把 堆 分 割 为 多 个 子 区 域 , 然后 并 行 地 独立 压缩 各 
个 子 区域 。 这 个 解决 方案 把 堆 碎片 化 。 通 过 使 用 虚拟 地 址 重 映射 ， 这 种 碎片 化 不 是 一 个 问题 。 

男 一 个 解决 方案 是 构造 对 象 间 依赖 关系 。 然 后, 回收 器 可 以 跟踪 这 个 依赖 关系 来 保持 需要 的 
顺序 。 


15.4.2 ”对 象 依赖 树 


构造 对 象 依赖 关系 的 思路 是 , 如果 一 个 活跃 对 象 会 被 另 一 个 活跃 对 象 覆 盖 , 那么 就 建立 被 窗 
盖 对 象 和 有 覆盖 对 象 之 间 的 一 个 依赖 关系 ,用 一 条 边 从 前 者 指向 后 者 。 如 果 一 个 对 象 有 一 条 进入 边 ， 
这 个 对 象 会 被 移动 到 这 条 边 的 来 源 处 ,并 和 宪 盖 那里 的 对 象 。 如 果 对 象 将 要 和 覆盖 它 本 身 , 也 会 构造 
一 条 从 自身 出 发 再 指向 自身 的 边 。 这样 就 在 所 有 活跃 对 象 之 间 形 成 了 一 个 依赖 树 。 这 个 树 按 如 下 
规则 使 用 。 

(1) 只 有 没有 进入 边 的 对 象 可 以 被 覆盖 。 当 指向 一 个 对 象 的 所 有 进入 边 都 已 经 被 移 除 时 ， 就 


可 以 覆盖 这 个 对 象 。 
(2) 当 一 个 对 象 完 成 对 另 一 个 对 象 的 覆盖 时 ， 就 移 除 从 后 者 到 前 者 的 边 ， 因 为 这 两 个 对 象 之 
间 再 也 没有 依赖 关系 了 。 


真正 构造 这 样 一 个 依赖 树 是 很 麻烦 的 。 在 实际 实现 中 , 堆 被 组 织 为 同样 大 小 的 块 ， 所 以 可 以 
在 块 间 构造 依赖 树 。 如 果 块 $ 中 一 个 活跃 对 象 会 被 移动 到 块 T， 那 么 块 S 是 另 一 个 块 工 的 源 块 。 
( 同时 块 T 是 块 $ 的 目标 块 。) 由 于 压缩 的 性 质 ， 目 标 - 源 关系 有 如 下 属性 。 

(1) 每 个 目标 块 有 一 个 或 多 个 源 块 ， 因 为 源 块 中 可 能 有 死亡 对 象 。 

(2) 每 个 源 块 有 一 两 个 目标 块 。 多 数 情况 下 ， 一 个 源 块 只 有 一 个 目标 块 。 在 另 一 些 情 况 下 ， 

当 一 个 目标 块 有 多 个 源 块 的 时 候 ， 最 后 一 个 源 块 ( 按 堆 地 址 顺序 ) 可 能 无 法 把 它 的 所 有 
活跃 对 象 都 移动 到 目标 块 。 其 中 的 一 些 必须 移动 到 第 二 个 目标 块 。 于 是 最 后 一 个 源 块 就 
有 两 个 目标 块 。 

(3) 一 个 块 可 能 依赖 于 自身 ， 如 果 其 中 一 些 活跃 对 象 要 被 移动 到 同一 个 块 中 的 话 。 例 如 ， 位 
于 堆 起 始 处 的 第 一 个 块 必 须 在 自身 内 部 压缩 活路 对象。 第 二 个 块 可 能 把 它 活跃 对 象 的 一 
部 分 移动 到 第 一 个 块 ， 另 一 部 分 移动 到 它 自 身 。 

图 15-6 展示 了 一 个 依赖 树 的 示例 ， 其 中 的 堆 有 12 个 块 。 
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图 15-6 块 间 依赖 树 
这 个 依赖 树 是 在 步骤 2 中 ， 当 回收 器 为 活跃 对 象 计算 新 地 址 的 时 候 构 造 的 。 所 有 的 回收 器 并 行 
执行 , 按照 堆 顺序 ( 或 块 索 引 顺 序 ) 竞争 抓 取 一 个 源 块 和 一 个 目标 块 。 这 是 为 了 维护 滑动 压缩 性 质 。 
为 了 更 详细 地 描述 这 些 规 则 ， 我 们 需要 定义 块 状态 和 状态 转换 。 
O UNHANDLED: 这 是 所 有 块 的 初始 状态 。 这 个 块 既 不 是 sre (W) 块 也 不 是 dest ( 目标 ) 块 。 


O IN COMPACT: 这 个 块 是 一 个 回收 器 的 sre 块 ， 也 就 是 说 ， 这 个 块 内 活跃 对 象 的 目标 地 址 
在 计算 中 。 


口 COMPACTED: 其 中 活跃 对 象 的 目标 地 址 已 被 计算 出 。 这 个 块 既 不 是 src 块 也 不 是 dest 块 。 
O TARGET: 这 个 块 是 某 个 回收 占 的 dest 块 。 


块 状态 转换 的 规则 如 下 所 述 ， 图 15-7 阐释 了 这 些 规则 。 






选中 作为 目标 地 址 计算 的 源 块 








在 完成 目标 地 址 
计算 之 前 选中 作 
为 目标 块 


选中 作为 目标 块 


图 15-7 并 行 压缩 器 中 块 的 状态 转换 
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(1) 起 初 所 有 块 都 为 UNHANDLED。 
(2) 回收 器 按照 堆 顺序 竞争 一 个 UNHANDLED 块 。 如 果 抓 取 到 一 个 块 ， 它 成 为 获胜 回收 器 
的 源 块 , 然后 它 的 状态 设置 为 IN COMPACT, 然后 失败 的 回收 器 按照 堆 顺序 竞争 下 一 个 
源 块 ， 直 到 堆 尾 。 
(3) 当 一 个 回收 器 为 它 的 源 块 中 所 有 活跃 对 象 完成 目标 地 址 计算 之 后 ， 它 把 这 个 块 的 状态 设 
置 为 COMPACTED， 然 后 回收 需 继 续 回 到 步骤 2 获取 一 个 新 源 块 。 
(4) 同时 ,所 有 的 回收 器 按照 堆 顺序 竞争 一 个 COMPACTED 块 。 如 果 拿 到 一 个 块 , 它 就 成 为 
获胜 回收 器 的 目标 块 ， 它 的 状态 被 设置 为 TARGET。 如 果 一 个 回收 器 在 到 达 它 的 源 块 
之 前 没有 按照 堆 顺序 拿 到 COMPACTED 块 , 这 个 回收 器 使 用 它 的 源 块 作为 目标 块 , 并 把 
它 的 状态 从 IN_COMPACT 修改 为 TARGET ( 即 同 一 个 块 既是 这 个 回收 器 的 源 块 也 是 目 
标 块 ). 
通过 这 种 方式 , 每 个 回收 器 总 是 同时 持 有 一 个 源 块 和 一 个 目标 块 。 对 于 源 块 中 的 每 个 活跃 对 
RB, 它 在 目标 块 中 计算 出 一 个 新 地 址 。 对 于 每 个 目标 块 ， 它 有 一 个 链表 链接 所 有 的 源 块 。 这 就 是 
依赖 树 的 表达 。 图 15-8 展示 了 依赖 树 的 内 部 表示 ， 对 应 于 图 15-6 中 的 依赖 树 。 每 个 块 都 有 一 个 
Het 记录 依赖 于 它 的 目标 块 的 数量 ,也 就 是 这 个 块 中 的 活跃 对 象 将 要 移动 到 的 目标 块 的 数量 。 
这 个 数字 是 0、1 或 者 2。0 意味 着 这 个 块 没有 活跃 对 象 需要 压缩 。 





O peat -- >is 
oo >[_6 }-->[10 ] 

-=--> 源 块 列表 
=: > m ] ---> 下 一 个 源 块 


图 15-8 ”依赖 树 的 内 部 表示 

有 了 依赖 树 和 所 有 活跃 对 象 的 新 地 址 ， 回 收费 可 以 在 步骤 4 中 移动 对 象 了 。 为 了 并 行 执行 步 
BRA, GC 使 用 一 个 共享 任务 池 来 协调 回收 器 间 的 负载 均衡 。 在 依赖 树 中 ， 池 中 的 任务 用 没有 进 
入 边 的 块 表示 (来 自 于 自身 的 进入 边 除外 )， 也 就 是 依赖 树 中 的 根 节点 ， 比 如 图 15-6 中 的 块 1、 
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块 2 和 块 3。 任务 是 把 来 自 于 它 的 源 块 的 活跃 对 象 移动 到 它 自身 中 。 一 开始 ， 任 务 池 中 有 依赖 树 
的 所 有 根 节 点 。 这 样 做 的 思路 是 , 用 根 节 点 表示 的 任务 可 以 由 回收 需 并 行 执行 且 无 须 同 步 ， 因 为 
这 些 任 务 之 间 没 有 依赖 关系 。 


一 个 源 块 中 的 活跃 对 象 被 复制 到 它 的 目标 块 之 后 , 从 目标 块 到 源 块 的 依赖 边 会 被 从 依赖 树 中 
移 除 。 这 可 能 会 使 一 些 之 前 的 子 节 点 成 为 新 的 根 节点 。 然后 这 些 根 节点 会 被 当 作 新 任务 放 入 任务 
池 。 既然 计算 量 由 被 移动 的 活跃 对 象 的 大 小 决定 , 那么 一 个 目标 块 对 应 一 个 任务 就 意味 着 每 个 任 
务 的 计算 量 在 各 个 回收 需 之 间 是 固定 的 。 负 载 是 平衡 的 , 除非 出 现 一 种 很 少见 的 情况 一 一 依赖 树 
过 深 ， 任 务 池 中 没有 足够 的 根 节点 。 

如 果 任 务 池 中 根 节点 的 数量 很 少 ，GC 可 以 把 很 深 的 树 打 雄 为 带 临 时 根 节点 的 子 树 。GC 在 
树 中 间 选 择 一 个 内 部 节点 ， 比 如 块 $。 它 是 某 个 ( 些 ) 父 节点 的 源 块 ， 也 是 一 个 子 树 的 根 节点 。 
GC 把 块 $ 的 内 容 复制 到 一 个 空 的 临时 块 工 中 ,然后 让 块 工 代替 块 $ 成 为 块 S 原来 父 节点 的 源 块 。 
现在 块 S 就 是 一 个 新 的 根 节点 , 可 以 放 入 任务 池 中 了 。 一 旦 压缩 完成 ,就 把 临时 块 工 中 的 数据 复 
制 到 块 S。 通 过 这 种 方法 ，GC 可 以 把 深 树 打 碎 为 多 个 子 树 ， 然 后 就 能 并 行 处 理 它们 。 

在 一 个 任务 内 还 可 以 更 加 并 行 化 。 比 如 ,从 任务 池 中 拿 出 一 个 目标 块 的 时 候 , 不 需要 用 单个 
回收 需 从 它 所 有 的 源 块 复制 数据 。 可 以 像 这 样 设 计 : 当 目 标 块 有 多 个 源 块 时 ， 如 果 它 目 己 也 是 一 
个 源 块 ， 回 收费 可 以 先 移 动 它 自身 的 活路 对象。 然后 剩 下 的 空 闪 空间 就 是 给 其 他 源 块 的 了 。 多 个 
源 块 可 由 多 个 回收 需 并 行 处 理 ， 因 为 所 有 这 些 对 象 移动 之 间 没 有 数据 依赖 。 


15.4.3” 带 用 于 转发 指针 的 目标 表 的 压缩 器 


如 果 把 活跃 对 象 的 目标 地 址 保存 在 一 个 辅助 数据 结构 ( 比如 目标 表 ) 中 而 不 是 对 象 关中 的 话 ， 
LISP2 压缩 器 不 一 定 要 严格 遵循 这 4 个 步 又。LISP2 压缩 器 需要 这 4 个 步骤 的 原因 是 ， 它 把 转发 
指针 保存 在 对 象 头 中 , 并 使 用 它 来 进行 引用 修正 。 只 有 在 堆 中 指向 某 个 对 象 的 所 有 引用 都 修正 以 
后 ，LISP2 压缩 器 才能 覆盖 这 个 对 象 。 

如 果 转 发 指针 保存 在 目标 表 中 , 并 在 对 象 和 它 的 转 至 地 址 之 间 建 立 好 映射 关系 , 那么 对 象 移 
动 阶段 和 引用 修正 阶段 的 顺序 可 以 是 任意 的 ， 也 可 以 放 在 同一 个 步骤 中 。 

目标 表 不 能 占用 太 多 内 存 ， 所 以 不 太 可 能 把 目标 表 中 的 一 个 地 址 映射 到 堆 中 最 小 对 象 的 大 
小 。 一 个 直观 的 解决 方案 是 把 这 个 地 址 映射 到 堆 中 的 一 节 (section )。 然 后 可 以 把 一 节 看 作 一 个 
“ 宏 对 象 "， 它 的 转发 指针 保存 在 目标 表 中 。GC 仍然 独立 标记 活跃 对 象 ， 所 以 回收 需 能 够 识别 一 
节 中 的 独立 活跃 对 象 。 这 与 使 用 节 来 进行 对 象 标记 是 不 同 的 。 在 那里 ， 如 果 一 节 被 标记 为 活跃 ， 
那么 其 中 所 有 对 象 都 被 认为 是 活跃 的 。 

使 用 这 种 目标 表 设 计 ， 可 以 在 移动 对 象 (步骤 3 ) 的 同时 对 它 进 行 引 用 修正 (步骤 4 )。 
图 15-9 展示 了 这 个 算法 的 步骤 。 
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1. 活跃 对 象 标记 








图 15-9 带 目标 表 的 LISP2 压缩 器 的 一 个 改进 


这 个 算法 的 解释 如 下 。 
O 步骤 1， 活跃 对 象 标 记 。 回 收 器 通过 从 根 集 追踪 遍历 堆 来 标记 活跃 对 象 。 
O 步骤 2， 对 象 重 定 位 。 从 头 到 尾 顺序 扫描 推 ， 回 收 器 计算 堆 的 一 节 中 活跃 对 象 的 目标 地 址 。 
每 节 的 目标 地 址 保存 在 一 个 目标 表 中 。 
O 步骤 3， 对象 移动 与 引用 修正 。 从 堆 起 始 处 开始 ， 回 收 器 按照 堆 顺 序 移动 活跃 节 ， 并 通过 
查找 目标 表 把 这 一 节 中 所 有 对 象 引 用 重 定位 到 被 引用 对 象 的 目标 地 址 。 
这 个 算法 没有 改变 并 行 化 策略 ， 而 是 减少 了 一 个 同步 屏障 。 这 提升 了 并 行 化 效率 , 代价 是 存 
储 目标 表 的 额外 内 存 需 求 。 
如 果 GC 设计 使 用 一 个 标记 表 来 映射 堆 中 的 每 个 对 象 ( 因此 隐 式 地 编码 了 对 象 大 小 )， 对 象 
重 定位 (步骤 2 ) 只 根据 标记 表 中 的 数据 就 可 以 完成 ， 不 用 扫描 堆 。 那 么 这 里 只 有 步骤 3 需要 一 
趟 堆 扫描 。 
另 一 方面 , 在 LISP2 压缩 器 中 ， 如 果 对 象 在 引用 修正 (步骤 3 ) 之 前 被 移动 ( 步骤 4 )， 那 么 
在 目标 表 的 帮助 下 ， 可 以 把 对 象 移动 ( 步骤 4 ) 与 新 地 址 计算 ( 步 又 2 ) 放 在 一 起 执行 。 图 15-10 
中 展示 了 这 个 算法 的 步骤 。 


1. 活 


2 





3. 引用 修正 





图 15-10 带 目标 表 的 LISP2 压缩 器 的 另 一 个 改进 
这 个 算法 的 解释 如 下 . 
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口 步骤 1， 活跃 对 象 标记 。 回 收 右 通过 从 根 集 追 踊 壳 历 堆 来 标记 活跃 对 象 。 
口 步骤 2， 对 象 重 定位 与 移动 。 堆 扫描 从 关 到 尾 顺序 进行 ， 回 收费 为 堆 的 一 节 中 的 活跃 对 象 
计算 目标 地 址 ， 并 且 把 它 移动 到 新 地 址 。 每 节 的 目标 地 址 保存 在 目标 表 中 。 在 某 些 设计 
中 ， 这 个 步骤 称 为 迁移 (relocation ) 。 

O 步 又 3， 引 用 修正 。 从 堆 起 点 开始 ， 通 过 查找 目标 表 ， 回 收 需 把 一 节 中 所 有 对 象 引用 重 定 
位 到 被 引用 对 象 的 目标 地 址 。 

这 个 设计 也 减少 了 一 个 同步 屏障 ， 同 时 保持 了 并 行 性 策略 。 它 需要 两 趋 堆 扫描 : 一 趟 用 于 对 

象 移动 ， 另 一 趟 用 于 引用 修正 。 


15.4.4 ”基于 对 象 节 的 压缩 右 


并 行 压缩 器 中 的 目标 表 可 以 是 一 个 地 址 数组 ， 其 中 一 个 地 址 映射 到 堆 中 的 一 节 ， 反 之 亦 然 。 
如 果 一 节 中 有 一 个 活跃 对 象 ,那么 整个 节 都 被 看 作 活 跃 的 。 通 过 这 种 方式 ,， 变 长 的 对 象 压 缩 问 题 
转化 为 固定 长 度 的 节 压 缩 问题 

由 于 现在 一 节 被 当 作 单个 对 象 对 待 ， 这 个 基于 目标 表 的 压缩 设计 的 有 效 性 依赖 于 以 下 假设 。 


口 tre dn ew 也 就 是 堆 中 有 很 多 死亡 节 。 
每 个 活跃 节 中 很 可 能 密集 填充 着 活跃 对 象 。 
ei ra To 耕 则 ,有些 应 用 程序 可 能 死亡 节 的 比例 很 小 ， 并 有 着 稀 跑 填 
FON TAL 。 如 果 GC 使 用 一 个 操作 系统 COS) 页 面 作为 一 个 节 ， 就 可 以 利用 虚拟 内 存 的 性 质 。 
如 果 页 面 中 有 一 个 活跃 对 象 ， 这 个 页 面 就 是 活跃 的 ; 否则， 这 个 页 面 就 是 死亡 的 ， 可 以 被 回 
收 。 一 种 压缩 堆 的 方式 是 像 平常 一 样 把 活跃 页 面 移 动 到 堆 的 一 端 。 基 于 OS 页 的 性 质 ， 另 一 种 方 
式 是 解 映射 (unmap ) 死亡 页 面 。 如 果 GC 解 映 射 死 亡 页 面 ， 就 不 需要 移动 活跃 页 面 ( 宏 对 象 ) 
了 ,因此 也 不 需要 对 象 重 定 位 和 引用 修正 。 然 后 ,压缩 可 以 通过 解 映射 堆 中 的 死亡 页 面 并 把 新 页 
面 重 映射 到 堆 的 一 端 来 实现 。 
也 可 以 把 这 个 设计 看 作 以 页 面 为 粒度 的 对 标记 清除 算法 的 扩展 。 下 面 给 出 其 操作 步 又， 如 
图 15-11 所 示 。 
口 步骤 1， 活跃 对 象 标 记 。 
O 步骤 2， 解 映射 内 部 没有 活跃 对 象 的 页 面 ， 重 映射 新 页 面 到 堆 的 一 端 。 
1. 活跃 对 象 标记 
ee 
1 TSE 
2. 空 闪 页 面 解 映射 与 重 映射 





a N N 
DOO + GA 








图 15-11 基于 标记 清除 和 页 面 映射 的 压缩 
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显然 步骤 1 和 步骤 2 很 容易 并 行 化 , 这 个 设计 又 减少 了 一 个 同步 屏障 。 但 是 这 个 设计 可 能 
很 大 的 空间 开销 ,因为 它 不 能 回收 活跃 页 面 中 的 死亡 对 象 。 当 页 间 碎 片 很 大 的 时 候 , 需要 一 次 回 
退 压缩 。 


15.4.5 ” 单 未 就 地 压缩 器 


一 个 很 日 然 的 问题 是 ,能 和 否 在 就 地 压缩 器 中 进一步 合并 这 些 步 又 。 首 先 ,把 活跃 对 象 标记 与 
其 他 步 又 合并 是 不 可 能 的 。 作 为 就 地 压缩 , 只 有 在 识 Lal RAT BRN > E 知 道 所 有 死亡 对 
象 ， 进 而 回收 它们 。 这 不 同 于 不 直接 回收 死亡 对 象 而 只 处 理 活跃 对 象 的 追踪 转发 回收 。 


把 对 象 重 定位 步骤 和 引用 修正 步骤 合并 为 一 步 是 可 能 的 。 引 用 修正 只 能 在 对 象 重 定位 完成 之 
后 完成 ; 否则 ,前 者 没有 所 有 活跃 对 象 的 新 地 址 来 更 新 引用 。 在 同一 个 步骤 中 执行 这 两 个 操作 的 
关键 是 ， 回 收 带 应 该 能 够 在 移动 一 个 活跃 对 象 的 时 候 找 到 所 有 指向 它 的 引用 。 


这 可 以 通过 在 对 象 X 被 移动 之 前 ， 把 所 有 包含 指向 对 象 X 的 引用 的 字段 相 链接 来 实现 。 链 
头 在 映射 到 对 象 X 的 目标 表 项 中 , 所 以 可 以 在 移动 X 的 时 候 找 到 这 个 链 并 更 新 它 。 在 X 移动 前 ， 
在 移动 其 他 对 象 的 过 程 中 需要 保持 这 个 链 有 效 。 

当 移 动 X 的 时 候 ， 这 个 目标 表 项 修改 为 对 象 X 的 新 地 址 。 稍 后 ， Shetland X 的 引用 
的 其 他 对 象 被 移动 的 时 候 ， 回 收 器 可 以 从 目标 表 中 找到 新 地 址 ， 并 更 新 这 个 引用 。 这 个 思路 基于 
Jonkers 和 Morris 的 连 线 指针 算法 (threaded pointer algorithm )， 但 它 al 
用 修正 合并 为 一 个 步骤 。 

图 15-12 展示 了 活跃 对 象 标 记 之 后 的 压缩 操作 。 我 们 称 之 为 “ 线 压缩 ”( thread-compact ) 回收 。 


目标 表 项 一 一 > 对 象 引用 
一 人 指定 地 址 -> 对 象 引用 
一 ss Tim 
目标 表 项 E 以 1 : 1 方式 映射 到 对 象 地 址 O 
Ts, i F 


ge- S a c 





(5) 
a 


图 15-12 线 压缩 操作 
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对 线 压缩 操作 的 解释 如 下 。 


(1) 活跃 对 象 标记 之 后 的 初始 状态 。 目 标 表 项 1 : 1 映射 到 堆 中 的 一 个 对 象 (或 一 节 )。 

(2) 当 移 动 一 个 活跃 对 象 后 ， 扫 描 它 的 字段 。 这 个 对 象 包含 的 指向 右 侧 的 引用 的 所 有 字段 ， 
被 链接 到 它们 各 自 的 连 线 引 用 链 中 。 已 移动 对 象 的 包含 指向 同一 个 未 移动 对 象 的 引用 的 
所 有 字段 ， 通 过 一 个 连 线 引 用 链 来 链接 在 一 起 。 未 移动 对 象 0 在 目标 表 中 有 一 个 对 应 的 
表 项 E， 它 是 对 象 O 的 连 线 引用 链 的 头 。 当 一 个 活跃 对 象 工 被 移动 ， 并 且 它 有 一 个 酸 
位 RR 包含 指向 O 的 引用 时 , 就 把 槽 位 R 链接 到 O 的 连 线 引 用 链 , 将 其 自动 插入 到 链 头 了 
之 后 。 

(3) 当 另 一 个 活跃 对 象 被 移动 后 ， 如 果 它 有 一 个 字段 包含 指向 右 侧 的 引用 ， 通 过 自动 更 新 目 
标 表 项 ， 这 个 字段 被 链接 到 这 个 引用 的 链 中 。 链 接 的 引用 字段 不 需要 保存 引用 值 ， 因 为 
目标 表 项 地 址 映射 到 了 引用 值 。 

(4) 当 一 个 活跃 对 象 被 移动 后 ， 这 个 对 象 的 所 有 链接 引用 字段 被 更 新 为 指向 这 个 对 象 的 新 位 

置 ， 包 括 目标 表 项 。 

(5) 当 一 个 活跃 对 象 被 移动 后 ， 扫 描 它 的 字段 。 包 含 指向 左 侧 对 象 的 引用 的 所 有 字段 都 被 更 
新 为 指向 对 应 的 目标 表 项 值 。 

线 压 缩 用 下 列 两 个 步 又 实现 就 地 压缩 。 

O 步骤 1， 标 记 活 跃 对 象 。 

口 步骤 2， 压缩 活跃 对 象 。 

这 两 个 步骤 都 可 以 并 行 化 。 对 于 处 理 活跃 对 象 右 侧 的 对 象 这 一 部 分 , 既然 对 象 的 新 地 址 已 知 ， 
那么 这 一 部 分 与 其 他 基于 目标 表 的 压缩 算法 相同 。 唯 一 值得 指出 的 一 点 是 引用 链 的 构造 。 当 多 个 
回收 器 都 在 移动 包含 指向 同一 个 右 侧 对 象 的 引用 的 对 象 时 , 它们 需要 更 新 同一 个 引用 链 。 每 个 回 
收 器 都 试图 把 它 的 引用 字段 插入 链 头 后 的 位 置 , 也 就 是 目标 表 项 ,它们 应 该 用 原子 操作 修改 目标 
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停止 世界 (stop-the-world, STW ) 式 垃 圾 回收 (GC) 有 一 个 明显 的 缺点 。 在 回收 过 程 中 ， 
应 用 程序 需要 被 暂停 。 在 服务 屁 系 统 中 这 是 个 问题 , 事务 处 理 延 迟 会 对 业务 有 很 大 影响 。 在 客户 
机 系统 中 它 也 是 不 受 欢 迎 的 ， 响 应 性 能 不 良 也 会 影响 用 户 交 互 体验 。 减少 回收 暂停 时 间 是 GC 社 
区 的 最 热门 主题 之 一 。 

减少 回收 暂停 时 间 的 常用 技术 是 让 回收 和 修改 并 发 运行 。 它 们 可 以 交替 执行 或 并 行 执 行 。 并 
行 执行 中 ,回收 器 和 修改 器 可 以 在 多 核 平台 不 同 核 上 的 不 同 线程 中 同时 运行 。 交 替 执行 中 ,回收 
髓 与 修改 器 并 不 同时 运行 ， 而 是 相互 交错 运行 。 

交替 执行 把 单 次 回收 分 割 为 几 个 更 短 的 阶段 , 因此 把 单独 一 次 应 用 程序 暂停 减少 为 几 次 更 短 
的 暂停 。 并 发 执行 允许 修改 器 在 回收 过 程 中 运行 ， 因 此 消除 了 回收 引起 的 应 用 程序 暂停 。 

从 一 个 完整 回收 周期 一 一 也 就 是 从 根 集 枚 举 到 死亡 对 象 被 回收 的 过 程 一 一 的 角度 看 , 交替 执 
行 与 并 行 执行 都 是 并 发 回收 。 从 设计 的 角度 看 , 让 回收 器 与 修改 器 并 行 执行 是 让 它们 以 交替 方式 
执行 的 一 个 超 集 。 在 GC 社区 中 ,前 者 ( 并行 执行 ) 通常 被 称 为 “并 发 式 GC”( concurrent GC ), 
而 后 者 ( 交替 执行 ) 被 称 为 “ 增 量 式 GC” (incremental GC )， 指 多 次 暂停 修改 器 执行 ， 以 递增 方 
式 完成 回收 。 还 有 一 个 正 交 的 术语 “并 行 GC”(parallel GC ) 是 指 回收 由 多 个 回收 器 并 行 执行 ， 
而 回收 本 身 可 以 是 并 发 式 或 增 量 式 的 。 

如 果 一 个 并 发 回收 顺和 一 个 修改 器 在 单 核 平 台 上 并 行 执行 ， 操 作 系 统 COS) 线程 调度 融会 
让 它们 自动 交替 执行 。 而 增 量 式 GC 自主 调度 回收 器 和 修改 器 。 由 于 虚拟 机 ( VM ) 对 回收 和 修 
改 任务 的 了 解 要 比 OS 调度 器 更 详细 ， 有 时 候 增 量 式 GC 可 以 获得 一 些 优势 ， 而 这 是 OS AYA A 
调度 很 难 获得 的 。 增 量 式 GC 的 情况 在 某 种 程度 上 与 实现 一 个 用 户 级 线程 调度 器 类 似 ， 现 代 平 台 
上 的 核 数 越 多 , 用 户 级 线程 调度 需 得 到 的 关注 就 越 少 , 或 者 只 在 特定 领域 能 够 引发 关注 。 本 章 主 
要 关注 并 发 式 GC。 


16.1 区域 式 GC 


现实 中 很 难 完全 消除 暂停 时 间 ， 所 以 社区 主要 致力 于 在 暂停 时 间 和 系统 性 能 之 间 获 得 平衡 。 
举例 来 说 , 为 了 减少 暂停 时 间 ， 前面 提 到 的 区 域 式 /分 代 式 GC 可 以 有 所 帮助 。 区 域 式 GC 把 堆 分 
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制 为 多 个 区 域 。 一 次 回收 涉及 一 个 或 几 个 区 域 。 活 跃 对 象 标 记 和 死亡 对 象 回收 的 方式 可 以 有 多 种 
设计 选择 。 

要 回收 一 个 区 域 ， 回 收 需 需要 知道 这 个 区 域 中 的 活路 对 象 。 在 追踪 式 GC 中 ,这 可 以 通过 全 
堆 遍 有 历 或 部 分 堆 遍 历 获 得 。 在 一 个 区 域内 的 部 分 堆 遍 历 过 程 中 ,应 该 在 记忆 集中 维护 从 其 他 区 域 
到 这 个 区 域 的 跨 区 域 引用 . 

图 16-1 是 一 个 示例 ， 展 示 了 来 自 根 集 和 跨 区 域 的 所 有 引用 。 

和 所 有 回收 一 样 ， 针 对 区 域 回收 ， 总 是 有 两 个 任务 需要 考虑 。 











图 16-1 来 自 根 集 和 跨 区 域 的 所 有 引用 


操作 1， 找 到 活跃 对 象 : 为 了 找到 区 域 中 所 有 活跃 对 象 ， 回 收 器 可 以 遍历 整个 堆 ， 也 可 
以 只 遍历 这 个 区 域 。 

追踪 整个 堆 可 能 比 遍 历 区 域 要 花费 更 多 时 间 ， 但 全 堆 遍 历 能 够 找到 堆 中 所 有 活跃 对 象 ， 
包括 其 他 区 域 的 。 了 解 所 有 活跃 对 象 给 了 回收 器 决定 回收 哪个 ( 些 ) 区 域 的 灵活 性 。 为 
了 获得 更 高 吞吐 量 ， 回 收 器 可 能 会 选择 活跃 对 象 最 少 的 区 域 。 这 是 GC 设计 所 做 的 一 个 
权衡 。 如 果 是 并 发 追踪 的 话 ， 长 时 间 全 堆 追 踪 不 一 定 总 是 一 个 问题 ,下 一 节 会 讨论 这 个 
问题 

只 追踪 指定 区 域 不 仅 需要 根 集 , 而 且 还 需要 记忆 集 , 其 中 包含 所 有 来 自 其 他 区 域 的 引用 
这 个 信息 由 写 屏 障 维护 , 它 跟踪 修改 器 对 堆 中 所 有 引用 的 更 新 。 如 果 一 个 完整 回收 周期 
想 要 通过 逐个 回收 区 域 来 回收 整个 堆 , 为 了 支持 对 每 个 区 域 的 区 域 回收 ， 写 屏障 需要 记 
忆 所 有 跨 区 域 引用 。 这 可 能 导致 巨大 的 修改 器 开销 。 有 时 ， 跨 区 域 引用 可 能 会 保留 大 量 
漂浮 垃圾 。 单 个 区 域 越 小 ， 漂 浮 垃 圾 就 会 越 多 。 

操作 2, 回收 死亡 对 象 : 找到 区 域 中 的 所 有 活跃 对 象 之 后 ,回收 器 就 可 以 清除 死亡 对 象 ， 
留 下 一 个 满 是 碎片 的 区 域 ,也 可 以 把 活跃 对 象 移动 到 其 他 区 域 , 留 下 一 个 空 的 连续 区 域 。 
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如 果 是 移动 式 回收 的 话 ，GC 应 该 为 迁移 的 对 象 保留 足够 的 空闲 空间 ， 或 者 就 在 区 域内 

就 地 压缩 , 之 后 所 有 指向 这 个 区 域 的 进入 引用 需要 被 更 新 到 指向 新 位 置 . 进入 引用 可 以 

通过 执行 写 屏 障 获 得 ， 或 是 回收 器 在 对 象 追 踪 / 移 动 过程 中 构造 的 。 正如 已 经 介绍 过 的 ， 

前 者 称 为 “修改 器 记忆 集 ”， 后 者 称 为 “回收 器 记忆 集 ” 

在 一 个 或 几 个 区 域 中 移动 对 象 的 速度 ， 通 常 足 够 快 ， 使 得 可 以 接受 此 时 STW 暂停 应 用 

程序 ( 即 修改 器 )， 和 否则，GC 可 以 选择 在 修改 器 运行 的 时 候 并 发 移动 对 象 。 后 面 这 种 情 

况 下 ，GC 就 必须 解决 竞 态 条 件 这 个 问题 ， 其 中 修改 器 和 回收 器 同时 访问 同一 个 对 象 ， 

并 且 其 中 一 个 访问 是 修改 ， 后 面 会 讨论 这 个 问题 。 

注意 上 面 的 两 个 操作 ( 找到 活跃 对 象 和 回收 死亡 对 象 ) 在 追踪 复制 式 GC 中 可 以 在 同一 趟 中 
一 起 执行 ， 对 此 我 们 已 经 介绍 过 。 

图 16-2 展示 了 一 次 区 域 回 收 前 后 的 状态 ， 假 定 区 域 3 中 的 活跃 对 象 被 移动 到 了 保留 区 域 

图 16-2 中 用 双 线 箭头 表示 进入 引用 。 如 果 把 被 回收 区 域 看 作 一 代 ， 把 其 余 区 域 看 作 另 一 代 ， 
那么 这 个 图 几乎 与 分 代 半 回收 相同 。 正 如 我 们 在 自 适应 GC 设计 中 讨论 过 的 ， 半 空间 的 两 个 部 分 
不 需要 大 小 相等 , 回收 器 可 以 把 多 个 区 域 的 活跃 对 象 移动 到 一 个 保留 区 域 。 这样 做 的 风险 是 保留 
区 域 可 能 容纳 不 下 所 有 存活 者 。 因 此 需要 设计 一 个 后 备 解决 方案 ， 比 如 使 用 一 次 回 退 就 地 压缩 。 
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图 16-2 移动 式 回 收 前 后 ， 进 入 引用 被 更 新 
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16.2 ”并 发 追踪 

找到 活跃 对 象 是 GC 的 两 个 主要 任务 之 一 。 如 果 追 踪 需 要 暂停 应 用 程序 的 话 ， 当 要 标记 的 活 
跃 对 象 数 量 相对 较 多 的 时 候 , 追踪 导致 的 程序 暂停 时 间 可 能 会 过 长 。 并 发 追踪 可 能 有 助 于 降低 暂 
停 时 间 ， 通 常 代 价 是 更 低 的 吞吐 量 。 

假定 回收 需 已 经 枚 举 了 修改 顺 栈 、 寄 存 器 和 全 局 变量 中 的 所 有 根 集 ， 然 后 修改 需 继 续 运行 ， 
回收 需 开 始 从 根 集 并 发 追踪 堆 。( 并 发 获得 根 集 的 操作 步骤 是 下 一 节 的 主题 。) 

满足 以 下 3 个 属性 的 追踪 设计 都 是 有 效 的 。 

(1) 正确 性 : GC 不 会 丢失 任何 活跃 对 象 。 

(2) 进步 性 : GC 不 会 保留 任何 死亡 对 象 太 长 时 间 。 保留 一 些 漂 浮 垃 圾 一 到 两 个 回收 周期 是 没 

有 问题 的 。 
(3) 可 终止 性 : 确保 追踪 阶段 会 结束 。 
本 节 中 我 们 讨论 并 发 追踪 算法 。 


16.2.1 起 始 快照 


使 用 STW 追踪 GC 的 时 候 ， 对 象 邻接 图 中 从 根 集 出 发 的 所 有 可 达 对 象 是 活跃 对 象 ， 其 余 的 
对 象 是 死亡 对 象 。 假 设 追 踪 起 始 阶段 的 活跃 对 象 集 为 工 ， 死 亡 对 象 集 是 刀 。 并 发 追踪 的 问题 是 ， 
当 修改 器 继续 运行 时 ， 回 收 器 遍历 对 象 邻 接 图 ， 然 而 对 象 邻接 图 是 在 变化 之 中 的 。 有 了 初始 根 集 
的 情况 下 ， 对 象 邻接 图 有 如 下 两 种 变化 方式 。 
O 修改 器 写 人 对 象 引用 字段 ， 这 可 能 会 导致 活跃 对 象 死 亡 。 假 定 在 活跃 对 象 集 L 中 ,仍然 
可 达 的 对 象 是 集合 AL。 我 们 有 工 AL. 
O 修改 器 创建 新 对 象 ， 在 修改 器 执行 过 程 中 ， 这 些 对 象 可 能 一 直 可 达 ， 也 可 能 死去 。 假 定 
在 追踪 过 程 中 新 创建 的 对 象 集 为 W， 在 追踪 阶段 结束 时 ， 它 们 中 可 达 的 对 象 为 集合 AN。 








RITA N 2 AN。 
那么 追踪 阶段 之 后 的 活跃 对 象 集 LEN 
L'=AL+AN 
图 16-3 展示 了 它们 之 间 的 关系 。 
get | 


` 


标记 过 程 中 新 创建 
\ N 
\ 
NA i se 


x 
标记 结束 时 活跃 AL AN 


图 16-3 并 发 追踪 过 程 中 的 集合 大 小 关系 
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并 发 追踪 设计 应 该 试图 找到 集合 AZ AIAN. BOYS LD AL 并且 N AN, 我们 有 如 下 关系 : 
AL+ANGL+N 

RRA, RE L + NN 是 追踪 阶段 结束 时 所 有 可 达 对 象 的 超 集 ， 如 果 并 发 追踪 设计 可 以 找到 

个 设计 就 满足 了 正确 性 要 求 。 只 要 它 满足 其 他 属性 ， 那 么 它 就 是 有 效 设 计 。 

集合 L 是 追踪 起 始 阶段 的 活跃 对 象 。 尽 管 修 改 融 修改 了 对 象 邻 接 岁 ， 仍 然 可 以 通过 捕获 

每 次 对 引用 字段 的 堆 写 人 的 写 屏 障 来 恢复 集合 L。 使 用 写 屏 障 ， 回 收费 知道 原来 的 引用 

值 ， 所 以 可 以 恢复 原来 的 对 象 邻 接 图 。 

口 集合 N 是 追踪 阶段 新 创建 的 对 象 集合 。 它 可 以 由 分 配 例 程 捕获 。 也 就 是 所 有 新 对 象 都 被 

直接 标记 为 活跃 。 

这 个 设计 的 思路 称 为 “起 始 快照 ”( snapshot-at-the-beginning，SATB )， 因 为 它 试 图 在 追踪 起 
台阶 段 找到 所 有 活跃 对 象 ， 作 为 对 象 邻接 图 的 一 个 快照 。 与 被 标记 为 活跃 的 新 创建 对 象 一 起 ,， 追 
踪 算 法 有 效 地 找到 了 追踪 阶段 结束 时 活跃 对 象 的 一 个 超 集 。 它 满足 追踪 算法 设计 的 正确 性 要 求 。 

使 用 SATB 追踪 , 快照 中 或 新 创建 对 象 中 的 一 部 分 对 象 可 能 在 追踪 过 程 中 死去 ,同时 仍 被 保 
留 。 这 不 是 一 个 问题 ， 因 为 它们 不 会 出 现在 下 一 个 回收 周期 的 快照 中 ， 因 此 肯定 会 被 回收 。 

由 于 快照 是 一 个 固定 的 对 象 集合 , 并 且 写 屏障 也 不 会 产生 新 对 象 , 这 确保 了 到 达 快 照 中 所 有 
对 象 之 后 ， 追 踪 阶 段 就 会 终止 。 

1. AFA SATB 

SATB iB eR ISA PA AS, EET, 95 EET ARI, AKR 
IJn, FREE PAKS AEBS YS BERRA. CERES, Be BE ORG EE IC a E 
覆盖 的 原来 的 引用 值 , 因此 是 SATB 概念 的 一 个 忠诚 实现 。 之 后 对 同一 个 对 象 的 写 需 要 被 再 次 捕 
ak, 因为 它 可 能 是 对 不 同 引用 字段 的 写 。 在 基于 对 象 的 设计 中 , 写 屏 障 在 修改 需 第 一 次 写 人 某 个 
对 象 的 引用 字段 时 ,记录 这 个 对 象 的 所 有 引用 字段 值 ,之 后 对 同一 个 对 象 的 写 不 会 记录 任何 信息 ， 
就 只 是 执行 字段 写本 身 。 

基于 覃 位 的 写 屏 障 码 如 下 所 示 。 

write_barrier_slot (Object* src, Object** slot, Object* new_ref) 

i ald ref = *slot; 


if( !is_marked(old_ref) ){ 
remember (old_ref) ; 


这 
Es 这 
口 


} 
*slot = new_ref; 


} 

原来 的 引用 (old ref ) 被 记录 在 记忆 集 里 。 既 然 写 屏障 捕获 堆 写 入 的 同时 ,回收 带 在 从 根 
集 开 始 追踪 堆 , 那么 记忆 集中 的 元 素 也 会 被 压 人 标记 栈 用 于 追踪 。 当 这 个 栈 空 了 的 时 候 , 追踪 阶 
段 终止 。 图 16-4 展示 了 一 个 修改 顺 执 行 了 两 次 对 象 字 段 写 之 后 的 写 屏 障 结果 。 
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基于 槽 位 的 SATB a = A.fl; A.f1 = Y; 
Afi = Z 








图 16-4 ”基于 覃 位 的 起 始 快 照 (SATB ) 并 发 追踪 


图 16-4 中 ， 到 对 象 B 的 引用 (Bl A.fl 的 旧 值 ) 保存 在 运行 时 栈 的 变量 a 中 。 如 果 没 有 写 
屏障 记忆 它 的 引用 ,对象 B 可 能 被 错误 地 当 作 死亡 对 象 。 


写 屏 障 不 会 生成 任何 快照 中 对 象 之 外 的 新 追踪 任务 。 修改 器 可 能 对 同一 个 字段 写 人 多 次 , 后 
面 的 写 入 也 会 触发 写 屏 障 执行 ， 导 致 记 住 的 引用 值 不 是 这 个 对 象 快 照 中 原来 的 值 。 
如 图 16-4 所 示 ， 引 用 X 是 写 人 一 个 对 象 字 段 fl MEL, 后 来 X 被 男 一 个 值 覆 六 ,那么 写 屏障 
会 记忆 引用 X。 这 个 引用 或 者 指向 一 个 在 快照 中 的 对 象 ,或 者 指 回 一 个 默认 被 标记 的 新 创建 对 象 ， 
不 会 导致 新 的 追踪 任务 。 所 以 在 快照 被 遍历 之 后 ， 条 件 检查 is_marked(old_ref) 总 是 返回 
TRUE， 不 会 生成 新 任务 。 
注意 ,基于 槽 位 设计 的 写 屏 障 没有 检查 要 被 写 入 的 对 象 是 否 被 标记 。 如 果 它 被 标记 了 ， 那么 
它 的 所 有 引用 字段 已 经 被 扫描 过 ， 因 此 不 需要 记忆 。 也 可 以 添加 如 下 代码 中 加 粗 显示 的 检查 , 不 
过 这 不 会 带 来 太 多 益处 。 
write_barrier_slot (Object* src, Object** slot, Object* new_ref) 
{ 
old_ref = *slot; 
if( !is_marked(src) && !is_marked(old_ref) ) { 
remember (old_ref) ; 
} 


*slot = new_ref; 


} 


mA, 是否 生 成 一 个 新 任务 ( Bl remember (old_ref) ) 由 old_ref 是 否 已 经 被 扫描 决定 。 
如 果 它 没有 被 扫描 ， 即 使 对 象 src 已 经 被 标记 过 ， 把 它 添 加 到 标记 栈 也 是 合理 的 。( 这 发 生 于 用 
指向 未 标记 对 象 的 引用 来 更 新 一 个 标记 过 的 对 象 的 情况 。) 

男 一 个 考虑 是 , 如果 不 检查 新 创建 对 象 的 标记 状态 , 针对 它 的 写 的 写 屏障 会 不 会 生成 很 多 宛 
余 工 作 。 再 次 说 明 ， 这 不 会 带 来 实际 的 区 别 ， 因 为 一 开始 快照 中 活跃 对 象 的 数量 就 决定 了 全 部 任 
务 量 。 任 何 情况 下 ， 基 于 覃 位 的 设计 确保 邻接 图 快照 中 的 任何 对 象 会 被 扫描 且 只 被 扫描 一 次 。 

男 一 方面 , 额外 的 检查 可 能 为 某 些 应 用 程序 带 来 一 些 益处 。 这 不 是 因为 额外 的 检查 能 够 减少 
任何 实际 工作 ， 而 是 因为 is_marked (src) 可 能 是 本 地 数据 访问 ,而 is_marked(old_ref) HJ 
能 是 远程 数据 访问 ， 它 们 的 缓存 局 部 性 不 同 。 如 果 对 象 写 非常 密集 的 话 ， 这 个 收益 是 可 见 的 。 
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2. 基于 对 象 的 SATB 
基于 对 象 的 写 屏 障 伪 代 码 如 下 所 示 。 


write_barrier_object (Object* src, Object** slot, Object* new_ref) 
{ 
if( !is_marked(src) && is_clean(src) ){ 
remember (snapshot of src); // 记忆 所 有 引用 
dirty (src); 
} 
*slot = new_ref; 


} 


除了 根 集 外 ， 一 个 对 象 的 快照 (sro 的 快照 ) 中 记忆 的 所 有 引用 也 被 压 人 标记 集 用 于 追踪 。 
当 这 个 栈 空 的 时 候 , 追踪 阶段 终止 。 图 16-5 展示 了 一 个 修改 器 执行 两 次 对 象 字 段 写 的 写 屏障 结果 。 


基于 对 象 的 SATB A.fl = X; A.fl = Y; 





H ik | 
图 16-5 ”基于 对 象 的 起 始 快照 (SATB ) 并 发 追踪 


一 步 观察 可 以 发 现 , 对 于 SATB 和 追踪， 基于 对 象 方法 是 比 基 于 槽 位 方法 更 忠实 的 实现 。 它 
在 一 个 对 象 被 写 人 之 前 拍 下 快照 ， 并 确保 追踪 这 些 引用 。 如 果 一 个 对 象 已 经 被 收集 上 器 扫描 过 ， 写 
屏障 将 不 再 拍摄 它 的 快照 ,因为 被 扫描 的 数据 和 快照 一 样 。 如 果 对 象 已 经 被 拍 下 快照 [ 即 被 弄 脏 
( dirty )]， 之 后 的 写 屏 障 不 会 再 次 拍摄 它 。 通 过 这 种 方式 ， 基 于 对 象 方法 确保 快照 邻接 图 中 对 象 
的 每 个 引用 字段 都 会 被 扫描 且 只 被 扫描 一 次 。 


注意 , 基于 对 象 设计 的 写 屏障 没 有 把 脏 对 象 设置 为 已 标记 。 这 里 一 个 对 象 被 标记 就 意味 着 这 
个 对 象 被 扫描 过 。 当 所 有 引用 都 被 记忆 后 , 这 实际 上 与 回收 需 扫 描 对 象 是 同样 的 操作 。 所 以 添加 
如 下 代码 中 的 加 粗 显 示 部 分 没什么 问题 ， 但 这 不 会 有 本 质 上 的 区 别 。 
write_barrier_object (Object* src, Object** slot, Object* new_ref) 
{ 
if( !is_marked(src) && is_clean(src) ){ 
remember(snapshot of src); // 记忆 所 有 引用 
dirty (sre) > 
mark(src) ; 
} 
*slot = new_ref; 
} 


不 管 一 个 对 象 是 否 被 标记 , 写 屏障 都 只 会 为 它 拍 一 次 快照 。 这 里 把 它 设置 为 标记 过 避免 了 回 
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收费 后 面 标记 它 ， 这 可 以 省 去 回收 费 再 次 扫描 这 个 对 象 。 男 一 方面 ， 既 然 这 个 对 象 被 写 了 , 它 有 
字段 被 修改 了 ， 其 中 的 新 引用 值 可 能 指向 一 个 未 标记 对 象 。 修 改 器 可 能 多 次 写 这 个 对 象 ， 就 安装 
了 多 个 新 引用 。 既 然 这 个 对 象 是 活跃 的 ， 这 些 新 引用 指向 的 对 象 也 是 活跃 的 〈 在 快照 邻接 图 中 ， 
或 者 是 新 对 象 )。 这 里 不 标记 这 个 对 象 给 了 回收 器 一 个 从 这 个 对 和 象 找 到 那些 未 标记 对 象 的 机 会 ， 
也 避免 了 修改 器 之 后 在 写 屏 障 中 复制 那些 未 标记 对 象 快照 ， 节 省 了 修改 需 的 工作 量 。 

3. 关于 SATB 的 讨论 

基于 酸 位 的 算法 和 基于 对 象 的 算法 实际 上 是 一 样 的 , 它们 都 返回 由 快照 决定 的 相同 的 活跃 对 
象 集 ， 其 中 包含 漂浮 垃圾 。 值 得 指出 的 是 ,在 性 能 方面 ， 它 们 的 确 有 区 别 。 基 于 对 象 的 写 屏障 只 
触 磁 要 被 写 的 对 象 的 数据 , 这 通常 可 以 得 到 更 好 的 数据 缓存 局 部 性 。 基 于 槽 位 的 方法 需要 检查 被 
引用 对 象 (new_ref ) 的 标记 状态 ,这 可 能 与 被 写 对 象 相 距 其 远 。 文 献 中 基于 槽 位 的 实现 被 称 为 
“DLG”" 算 法 ， 基 于 对 象 的 实现 称 为 “快照 ”算法 。 

多 个 修改 器 同时 写 入 同一 个 对 象 不 会 有 任何 正确 性 问题 ,多 个 修改 器 有 可 能 交替 执行 写 屏 障 
代码 ， 所 以 它们 读 到 同样 的 旧 值 , 或 者 只 有 一 个 修改 器 读 到 旧 值 。 只 要 旧 值 被 读 到 就 好 ,这样 就 
保持 了 SATB 性 质 。 无 论 是 基于 槽 位 还 是 基于 对 象 的 写 屏 障 ， 这 个 性 质 都 是 一 样 的 。 

也 可 以 利用 OS/ 人 硬件 支持 实现 SATB 追踪 ,也 就 是 用 页 面 异常 处 理 函 数 代 蔡 写 屏 障 。 在 堆 追 
踪 开 始 时 ， 所 有 的 堆 都 是 页 保护 的 。 只 要 有 对 一 个 页 面 的 写 人 ， 就 会 触发 异常 ， 并 复制 包含 此 页 
中 所 有 旧 引 用 的 页 数据 。 这 个 设计 中 页 面 异 常 处 理 和 数据 复制 的 开销 过 高 , 所 以 可 能 只 有 理论 上 
的 意义 。 


16.2.2 See 
与 SATB 不 同 ， 另 外 一 种 并 发 追踪 方法 试图 捕获 所 有 当前 活跃 对 象 。 
1. 引用 记忆 INC 
每 当 有 对 引用 字段 的 写 操作 , 写 屏 障 就 会 记忆 新 值 ， 而 不 是 记忆 旧 值 。 这 个 写 屏 障 可 写 为 如 
下 的 伪 代 码 。 我 们 称 之 为 “记忆 引用 ”INC 写 屏障 。 
write_barrier_ref(Object* src, Object** slot, Object* new_ref) 
{ 
*slot = new_ref; 
if( is_marked(src) ) 


remember (new_ref) ; 


} 

如 果 这 个 对 象 已 经 被 标记 了 , 写 屏障 会 记忆 这 个 新 引用 。 被 记忆 的 引用 会 被 压 人 回收 器 的 标 
记 栈 , 用 于 并 发 追踪 。 不 需要 在 对 象 被 标记 之 前 记忆 新 引用 ， 因 为 在 对 象 被 标记 的 时 候 ， 如 果 这 
个 新 引用 还 没有 被 覆盖 的 话 ， 它 会 被 追踪 。 如 果 这 个 对 象 已 经 被 标记 过 ， 就 不 会 被 再 次 扫描 ,所 
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以 对 它 写 入 的 新 引用 需要 被 记忆 并 追 踩 。 

如 果 能 够 记忆 系统 ( 包括 堆 、 执 行 上 下 文 、 全 局 变量 ) 中 所 有 的 引用 更 新 ， 这 个 设计 就 没有 
正确 性 问题 。 在 GC 社区 中 ， 这 个 思路 称 为 “ 增 量 更 新 ”( incremental-update，INC )， 因 为 它 增 
量 式 地 修改 对 象 邻接 图 来 保持 它 为 最 新 。 与 之 相对 的 是 SATB， 它 维护 快照 。 

INC 追踪 不 需要 把 新 对 象 默认 标记 为 活跃 ,它们 的 活性 和 已 有 对 象 一 样 由 追踪 算法 决定 。 如 
果 一 个 对 象 是 活跃 的 ， 它 的 引用 一 定 被 写 人 到 了 系统 的 某 个 位 置 ， 可 以 被 写 屏 障 捕获 。 

2. INC 第 二 轮 追 踪 

INC 设 计 的 问题 是 , 在 并 发 追踪 中 , 尽管 所 有 指向 活跃 对 象 的 引用 都 被 写 人 到 系统 的 某 个 位 
置 ， 其 中 一 些 可 能 没有 写 和 人 堆 中 对 象 。 例 如 ,它们 可 以 写 入 运行 时 栈 或 寄存 器 。 没 有 什么 高 效 的 
方法 可 以 追踪 对 它们 的 更 新 。 

不 妃 踩 堆 外 更 新 ，INC 设计 就 不 能 保证 正确 性 。 图 16-6 给 出 了 一 个 INC 追踪 中 引用 丢失 的 
示例 。 
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图 16-6 INC 追踪 漏 过 活跃 对 象 的 一 个 例子 


为 了 改正 INC 算法 可 能 丢失 活跃 对 象 这 个 问题 , GC 需要 在 INC 追踪 之 后 执行 另 一 轮 非 INC 
活跃 对 象 标记 。 它 可 以 使 用 STW 追踪 或 其 他 任何 已 知 的 正确 方法 ， 比 如 SATB。 一 个 用 STW 作 
为 第 二 轮 追 踪 的 INC 算法 称 为 “大 致 并 发 ”， 因 为 它 不 是 完全 并 发 的 。 

第 二 轮 活 跃 对 象 标 记 不 需要 重新 遍历 整个 堆 来 找到 所 有 活跃 对 象 。 它 并 不 追踪 已 经 被 第 一 轮 
并 发 追踪 标记 为 活跃 的 对 象 。 第 二 轮 追 踪 的 目标 只 在 于 找到 第 一 轮 没 有 标记 的 活跃 对 象 , 因为 在 
INC 追踪 过 程 中 它们 只 从 更 新 过 的 根 集 可 达 。 换 句 话说 , 第 一 轮 错 过 的 活跃 对 象 应 该 不 用 扫描 第 
一 轮 标记 过 的 对 象 也 能 找到 。 

换个 角度 看 ， 如 果 一 个 活跃 对 象 Y 只 能 从 第 一 轮 标 记 的 对 象 X 到 达 ， 那 么 Y 在 第 一 轮 妃 踪 
中 不 会 被 错过 。 如 果 在 第 一 轮 追 踪 开 始 时 ，Y 的 引用 存在 于 X， 并 且 没 有 在 追踪 过 程 中 被 覆盖 ， 
追踪 过 程 应 该 能 够 通过 X ENA Y 并 标记 它 。 如 果 Y 的 引用 存在 于 X， 是 由 于 修改 器 把 值 Y 写 入 
X 的 一 个 字段 ， 写 屏障 会 记 住 Y， 并 且 回 收 器 肯定 会 标记 它 。 

所 以 第 二 轮 追 踪 不 需要 扫描 第 一 轮 标记 的 对 象 , 也 不 会 丢失 活跃 对 象 。 正 确 性 通过 合并 两 轮 
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互补 的 追 踊 得 以 保持 。 

在 某 些 GC 设计 中 ,第 二 轮 追 踪 也 用 作 下 一 次 回收 的 根 集 枚 举 。 在 这 类 设计 中 ，GC 接连 执 
行 ， 不 会 结束 。 用 根 集 枚 举 阶 段 来 完成 上 一 次 回收 并 开始 当前 回收 。 

在 SATB 设计 中 , 记忆 的 引用 数量 是 有 上 限 的 ， 这 个 上 限 在 追踪 一 开始 就 确定 了 。 在 基于 槽 
位 的 SATB 中 ,被 记忆 引用 的 数量 不 多 于 快照 中 活跃 对 象 的 数量 。 在 基于 对 象 的 SATB IP, Kid 
忆 的 对 象 快照 不 多 于 快照 中 的 修改 器 在 回收 需 标 记 之 前 写 人 的 活跃 对 象 数量 。 

在 INC 设计 中 ,被 记忆 的 引用 的 数量 是 在 堆 中 对 象 被 标记 后 写 人 这 些 对 象 的 引用 的 数量 。 
这 个 数字 没有 上 限 。 只 要 追踪 还 在 进行 ,这 个 数字 就 会 增加 ， 因 为 修改 器 同时 也 在 运行 。 这 意味 
着 并 发 追踪 没有 自然 的 终止 点 。 必 须 有 一 个 调度 算法 就 地 决定 何 时 是 停止 INC 追踪 并 启动 第 二 
轮 追 踪 的 最 佳 时 间 点 。 后 者 必然 有 算法 内 建 的 终止 点 。 

3. 记忆 根 INC 

注意 INC 写 屏 障 并 不 检查 对 象 是 否 为 脏 对 象 。 如 果 一 个 对 象 在 标记 后 被 写 信 ， 它 就 是 脏 对 
Z, 意味 着 这 个 对 象 中 有 一 个 新 引用 需要 被 记忆 。 在 一 个 对 象 变 成 脏 对 象 之 后 ,对 它 后 来 的 任何 
引用 写 (即使 是 同一 个 覃 位 ) 都 应 该 被 记忆 。 

对 于 被 修改 器 写 入 的 覃 位 , INC 设计 其 实 应 该 只 记忆 这 个 槽 位 在 第 二 轮 追 踪 开 始 之 前 最 后 的 
引用 值 。 所 有 之 前 写 入 这 个 槽 位 的 值 都 不 需要 了 ， 因 为 只 有 最 终 引 用 值 形成 最 新 的 对 象 邻 接 图 。 
记忆 所 有 槽 位 更 新 可 能 在 时 间 上 和 空间 上 都 会 带 来 巨大 的 开销 。 追踪 的 终极 目标 是 找到 追踪 阶段 
结束 时 所 有 的 活路 对象， 而 不 是 过 程 中 所 有 的 临时 活路 对象， 它们 中 有 许多 都 会 在 INC 追踪 阶 
段 结束 前 死去 。 

基于 这 个 观察 结果 ， 可 以 设计 INC 写 屏 障 的 一 个 变 体 来 记忆 脏 对 象 ， 而 不 是 写 和 人 的 每 个 新 
引用 。 然 后 把 被 记忆 对 象 添 加 到 第 二 轮 追 踪 的 根 集 ， 用 于 再 次 扫描 。 我 们 称 之 为 “记忆 根 ”INC 
设计 。 

write_barrier_root (Object* src, Object** slot, Object* new_ref) 

{ 

*slot = new_ref; 

if( is_marked(src) && is_clean(src) ){ 
dirty (src); 
remember (src) ; 


} 
} 


使 用 记忆 根 INC 写 屏障 ， 当 一 个 引用 被 写 人 一 个 标记 过 的 活跃 对 象 时 ， 这 个 对 象 就 被 设置 
为 脏 的 ,表示 这 个 对 象 包含 新 引用 ， 以 后 应 该 被 重新 扫描 。 通 过 这 种 方式 ,INC 设计 不 需要 记忆 
写 信 堆 的 所 有 新 引用 ， 只 需要 标识 在 第 二 轮 追 踪 中 需要 重新 扫描 的 堆 区 域 即 可 。 

写 屏障 支持 多 个 修改 占 并 行 执 行 。 同 一 个 对 象 可 能 多 次 变 脏 ， 这 不 会 导致 正确 性 问题 。 
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4. 关于 INC 的 讨论 

INC 设计 中 记忆 根 和 记忆 引用 的 关系 ， 类 似 于 分 代 式 GC 中 牌 桌 和 记忆 集 的 关系 ， 也 类 似 于 
SATB 设计 中 基于 对 象 设计 和 基于 覃 位 设计 的 关系 。 

对 于 INC 设计 来 说 ， 虽 然 记 忆 根 不 需要 记忆 所 有 的 中 间 引 用 写 ， 但 它 不 一 定 优 于 记忆 引用 。 
哪个 写 屏障 更 好 ,完全 取决 于 应 用 程序 特性 。 如 果 没 有 大 量 引 用 写 或 引用 覆盖 ， 记 忆 引 用 可 能 更 
高 效 , 因为 它 不 需要 积累 记忆 的 引用 , 也 不 需要 把 它们 添加 到 根 集 用 于 第 二 轮 追 踪 。 被 记忆 之 后 ， 
回收 需 就 可 以 追踪 它们 。 然 而 ， 在 第 二 轮 追 踪 之 前 ， 记 忆 集 中 剩余 的 那些 还 没有 被 追踪 的 对 象 ， 
需要 被 添加 到 根 集 。 

GC 也 可 以 选择 一 旦 根 被 记忆 就 重新 扫描 它们 ， 而 不 是 把 它们 添加 到 根 集 用 于 第 二 轮 追 踪 。 
这 种 情况 下 ， 如 果 它 们 中 任何 一 个 在 第 二 轮 启 动 之 前 被 重新 扫描 ,它们 必须 被 重 置 为 干净 的 ,这 
样 对 这 些 对 象 的 新 写 入 才能 再 次 被 写 屏障 捕获 。 

既然 INC 追踪 可 能 遗漏 活跃 对 象 ， 需 要 一 轮 正确 追踪 来 修正 ， 在 最 终 一 轮 正确 追踪 之 前 多 
进行 几 轮 INC 追踪 也 是 没有 问题 的 。 中 间 INC 追踪 轮 可 以 从 根 集 或 记忆 集 开 始 ， 也 可 以 同时 由 
二 者 开始 。 这 都 无 所 谓 ， 因 为 INC 追踪 轮 不 试图 提高 追踪 精确 性 (或 正确 性 )， 而 是 旨 在 帮助 找 
到 更 多 的 活跃 对 象 ， 以 节省 最 后 一 轮 正确 追踪 的 时 间 。 

如 果 是 记忆 根 INC, 那么 任何 被 重新 扫描 的 已 记忆 对 象 都 应 该 被 设置 为 干净 的 。 之 后 对 这 个 
对 象 的 更 新 会 使 它 再 次 被 设置 为 脏 的 。 根据 我 们 的 理论 , 任何 情况 下 , 所 有 的 更 新 还 没有 被 扫描 
的 已 标记 对 象 ， 包 括 根 集 ， 都 应 该 包含 在 最 后 一 轮 正确 追踪 之 前 的 记忆 和 集中。 

从 性 能 的 方面 来 讲 ， 在 INC 追踪 中 ， 新 对 象 创建 后 是 未 标记 的 。 对 一 般 应 用 程序 来 说 ， 由 
于 它们 创建 大 量 存活 时 间 很 短 的 对 象 ， 这 有 可 能 显著 减少 漂浮 垃圾 。 

尽管 INC 追踪 需要 额外 的 一 轮 正 确 追 踪 ， 这 并 不 意味 着 INC 追踪 需要 引发 更 多 暂停 ， 因 为 
更 少 的 漂浮 垃圾 有 助 于 提高 回收 吞吐 量 ， 所 以 可 以 推迟 触发 下 一 轮回 收 。 


16.2.3 ”用 三 色 术 语 表 示 并 发 追踪 
现在 ,我 们 从 另 一 个 角度 讨论 并 发 追踪 。 
在 回收 遍历 图 G 的 一 部 分 之 后 , 比如 G 的 AG 部 分 已 经 被 扫描 过 , 其 余部 分 (G 一 AG) 还 没有 。 
当 修改 器 写 人 堆 并 修改 G 的 结构 的 时 候 ， 可 能 产生 两 种 效果 。 
(1) 它 可 能 会 使 一 些 AG 中 的 已 经 扫描 过 的 对 象 死亡 ， 并 作为 漂浮 垃圾 被 保留。 
(2) 它 也 可 能 也 会 使 一 些 (G - AG) 中 的 未 扫描 对 象 失去 原来 在 (G - AG) 中 的 连接 ， 而 只 与 AG 
中 扫描 过 的 对 象 连接 。 


第 一 种 情况 不 会 导致 任何 正确 性 问题 ， 而 第 二 种 情况 则 可 能 会 导致 问题 发 生 。 图 16-7 展示 
了 第 二 种 情况 。 
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图 16-7 在 并 发 追踪 过 程 中 可 能 丢失 的 对 象 


用 三 色 术 语 表 述 ， 扫 描 过 的 对 象 在 AG 中 显示 为 黑色 ， 未 扫描 对 象 在 (G 一 AG) 中 显示 为 白色 ， 
边界 上 的 对 象 [ 追踪 过 程 中 的 波 前 ( wave-front ) ] 显示 为 灰色 。 灰 对 象 是 被 黑 对 象 引用 但 还 没有 
被 扫描 的 对 象 。 换 名 话说, 已 经 知道 灰 对 象 是 可 达 的 , 但 它们 引用 的 对 象 还 未 确定 。 从 黑 对 象 到 
白 对 象 没有 直接 引用 。 


假定 一 个 可 达 白 对 象 W 在 (G 一 AG) 中 连接 ， 一 个 灰 对 象 或 白 对 象 的 权 位 S$ 中 的 引用 指向 它 。 
如 果 一 个 修改 器 从 梭 位 S 读 取 这 个 到 对 象 W 的 引用 ， 把 它 安装 到 黑 对 象 B 中， 并 且 用 男 一 个 值 
覆盖 原来 的 槽 位 S, 那么 修改 器 就 创建 了 一 条 从 黑 对 象 到 白 对 象 的 边 。 这 个 导致 图 16-7 中 的 改变 
的 操作 如 下 所 示 : 
1: a= *S; // S 持 有 指向 W 的 引用 
2: B.f = a; // 在 B 中 写 入 对 W 引 用 
3: *S = b; // RE2S 中 原来 的 引用 
如 果 没 有 SATB 或 者 INC 写 屏障 ， 可 达 对 象 W 可 能 被 于 失 ， 因 为 已 经 被 扫描 过 的 对 象 B 不 
会 被 再 次 扫描 。 
使 用 SATB 写 屏 障 ， 在 覆盖 原来 槽 位 S 的 时 候 会 捕获 到 原来 对 对 象 W 的 引用 。 
使 用 INC 设计 的 话 ， 情 况 有 些 不 同 。 因 为 INC 只 记忆 新 写 入 的 引用 ， 而 不 是 原来 被 覆盖 的 
引用 ， 它 应 该 捕获 新 的 边 ( 在 图 16-7 中 用 双 线 箭头 表示 )。 
使 用 INC 设计 可 能 丢失 对 象 的 情况 有 以 下 3 种 。 
口 情况 1。 原 来 在 (G 一 AG) 中 可 达 的 对 象 ， 现 在 只 能 从 AG 中 已 经 扫描 过 的 对 象 到 达 。 这 些 
对 象 被 INC 写 屏障 追踪 。 
O 情况 2。 原 来 在 (G 一 AG) 中 可 达 的 对 象 ， 现 在 只 能 从 非 堆 位 置 到 达 ， 比 如 运行 时 栈 、 寄 存 
需 ， 等 等 。 这 些 位 置 是 根 集 所 在 的 位 置 ， 不 被 写 屏 障 追 踪 。 
O 情况 3。 在 INC 追踪 开始 之 后 创建 的 新 对 象 ， 现 在 只 能 从 AG 中 已 经 扫描 过 的 对 象 到 达 ， 
或 者 只 能 从 非 堆 位 置 到 达 。 这 种 情况 涵盖 了 上 面 的 情况 1 和 情况 2。 
根据 上 述 观察 结果 , 对 INC 设计 而 言 , 第 二 轮 追 踪 是 必需 的 。 第 二 轮 追 踪 应 该 从 记忆 和 集 ( 针 
对 情况 1 ) 和 根 集 ( 针对 情况 2 ) 追踪 对 象 邻 接 图 。 实 际 上 ， 可 以 把 非 堆 位 置 看 作 被 修改 器 持续 
更 新 的 虚拟 对 象 。 


16.2.4 ”使 用 读 屏障 的 并 发 追踪 
并 发 堆 追 踪 也 可 以 用 读 屏 障 实现 。 例 如 ,每 当 一 个 引用 被 加 载 到 修改 器 执行 上 下 文 时 ， 如 果 
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被 引用 的 对 象 还 没有 被 标记 的 话 ， 就 把 这 个 引用 压 入 标记 栈 用 于 追踪 。 同 时 ,回收 融通 过 把 根 引 
用 压 入 标记 栈 并 发 追踪 堆 。 出 于 以 下 的 原因 ， 这 个 设计 不 需要 像 SATB 一 样 记忆 被 修改 名 餐 盖 的 
原来 的 引用 值 。 
O 如 果 被 覆盖 的 引用 是 到 一 个 对 象 的 唯一 路 径 ， 这 次 覆盖 会 使 这 个 对 象 死 去 ， 因 此 不 需要 
WILE. 

O 如 果 还 有 从 根 集 到 这 个 对 象 的 其 他 路 径 ， ABA EAE. 

O 如 果 被 覆盖 的 引用 是 唯一 路 径 ， 并 且 修 改 絮 把 这 个 引用 安装 到 男 外 某 处 ( 比如 运行 时 
栈 、 寄 存 器 、 已 标记 对 象 ， 或 未 标记 对 象 ) ， 那 么 读 屏 障 可 以 捕获 它 。 

这 个 解决 方案 似乎 比 基 于 写 屏 障 的 解决 方案 要 简单 得 多 。 问题 是 为 每 个 引用 访问 加 入 读 屏 障 
开销 过 于 高 昂 。 如 果 只 是 用 于 并 发 堆 追 踪 , 那么 很 少 在 实际 GC 设计 中 使 用 这 种 方案 。 但 是 这 个 
思路 被 广泛 应 用 于 并 发 移动 式 GC 中 , 其 中 活跃 对 象 在 修改 融 执 行 的 同时 被 移动 。 同 一 个 对 象 可 
能 有 两 个 副本 。 当 一 个 修改 器 加 载 一 个 对 象 引用 , 用 于 对 象 读 或 写 的 时 候 ， 必 须 了 解 它 应 该 访问 
哪个 副本 : 是 原来 的 ， 还 是 迁移 后 的 。 读 屏障 对 于 动态 寻找 正确 副本 很 有 用 。 我 们 将 在 讨论 并 发 
移动 式 GC 的 时 候 深 入 讨论 这 个 主题 。 


16.3 ”并 发 根 集 枚 举 


关于 并 发 追踪 的 讨论 中 ， 没 有 提 及 如 何 枚 举 根 集 ， 这 是 因为 并 发 根 集 枚 举 是 并 发 追踪 的 
超 集 。 

SATB 理论 要 求 拥 有 对 根 集 的 快照 。 得 到 根 集 快照 最 直观 的 方法 是 停止 世界 CSTW )， 也 就 
是 暂停 修改 器 , 并 在 恢复 任何 修改 器 之 前 枚 举 根 集 。 通 过 这 种 方式 ,我 们 把 所 有 修改 需 的 整个 根 
集 看 作 一 个 虚拟 对 象 。 

如 果 有 很 多 修改 器 的 话 ， 这 个 STW 根 集 枚 举 可 能 导致 明显 的 应 用 程序 暂停 。 我 们 并 不 希望 
对 一 个 修改 器 的 枚 举 会 阻塞 另 一 个 修改 器 。 一 个 修改 器 的 根 集 可 以 被 看 作 一 个 虚拟 对 象 , 包括 它 
的 运行 时 栈 和 寄存 器 ， 可 以 独立 于 其 他 修改 器 而 枚 举 。 这 就 是 并 发 根 集 枚 举 。 


GC 可 以 一 个 接 一 个 地 暂停 目标 修改 器 ， 为 每 个 修改 器 的 根 集 拍 下 快照 。 当 一 个 修改 融 被 暂 
停 的 时 候 ， 其 他 修改 器 可 以 继续 执行 。 

另外 一 种 方式 是 ，GC 设置 一 个 全 局 标志 来 指示 现在 是 根 集 枚 举 时 间 ， 所 有 的 修改 融通 过 在 
一 个 GC 安全 点 枚 举 自身 并 向 GC 报告 根 集 来 响应 这 个 标志 。 这 种 情况 下 不 需要 线程 暂停 ， 但 需 
要 修改 顺和 GC 之 间 通 过 标志 来 同步 ， 即 需要 握手 。 

在 这 两 种 情况 下 ( 暂停 或 握手 )， 一 个 修改 咒 的 根 集 都 被 枚 举 为 快照 。 修 改天 需要 暂停 它 的 
执行 来 进行 根 集 枚 举 。 换 句 话说 ， 当 正在 拍摄 修改 咒 根 集 快照 的 时 候 ,， 修 改天 不 改变 它 的 栈 或 寄 
存 器 。( 可 以 不 完全 暂停 一 个 修改 器 的 执行 来 枚 举 它 的 根 集 ， 后 面 我 们 会 介绍 。 
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GC 可 以 等 到 获得 所 有 修改 融 的 根 集 之 后 才 开 始 标记 活跃 对 象 。 它 也 可 以 在 开始 根 集 枚 举 的 
同时 开始 活跃 对 象 标记 。 我 们 先 介 绍 前 面 的 情况 。 


16.3.1 并 发 根 集 枚 举 设计 


GC 拥有 了 修改 器 M 的 根 集 快照 之 后 , 其 他 一 些 修改 器 可 能 处 于 根 集 枚 举 前 后 的 应 用 程序 代 
码 执行 状态 ， 也 可 能 在 根 集 枚 举 过 程 中 。 

与 追踪 对 象 邻 接 图 类 似 , 修改 顺 M 可 能 在 快照 拍摄 之 后 , 有 向 它 的 栈 中 写 入 对 象 X 的 引用 。 
如 果 在 系统 的 其 他 位 置 没有 对 对 象 X 的 引用 ， 也 就 是 说 ， 堆 、 其 他 修改 器 执行 上 下 文 或 者 全 局 
变量 中 都 没有 , 那么 这 个 对 象 X 不 会 被 GC 发现， 于 是 会 被 认为 已 经 死亡 。 这 种 情况 类 似 于 前 面 
关于 对 象 邻 接 图 的 讨论 ， 如 图 16-8 所 示 。 





图 16-8 并 发 枚 举 中 可 能 丢失 的 对 象 


用 三 色 术 语 表述 , 如 果 把 一 个 修改 器 的 根 集 看 作 一 个 虚拟 对 象 的 话 , 那么 它 在 被 枚 举 之 前 总 
是 灰色 的 ， 原 因 是 根 集 总 是 已 知 可 达 ， 而 它们 引用 的 对 象 在 根 集 枚 举 之 前 还 不 确定 。 


在 对 象 X 的 引用 被 写 人 M 的 栈 中 之 前 ， 作 为 一 个 可 达 对 象 ， 它 一 定 处 于 以 下 四 种 状态 中 的 
一 个 或 多 个 。 为 了 避免 丢失 对 对 象 X 的 引用 ， 并 发 枚 举 必 须 在 下 面 的 任何 情况 中 都 能 够 捕获 这 
个 引用 。 
情况 1: 对 象 义 的 引用 过 去 在 堆 中 ,现在 只 存在 于 修改 器 M 的 上 下 文中 。 
在 修改 器 M 的 根 集 被 枚 举 之 后 , GC 开始 标记 活跃 对 象 之 前 , 包含 引用 义 的 对 象 字 段 被 
其 他 值 履 盖 。 写 屏障 如 果 记 忆 被 更 新 字段 的 旧 引 用 值 ， 就 可 以 捕获 这 个 引用 ， 类 似 于 
SATB 基于 楷 位 的 写 屏 障 。 这 个 写 屏 障 的 伪 代 码 如 下 所 示 。IS_ENUMERATING 是 一 个 全 
局 标志 ， 指 示 系 统 是 否 处 于 并 发 枚 举 之 中 。 
write_barrier_enum_only(Object* src, Object** slot, Object* new_ref) 
{ 
old_ref = *slot; 
if( IS_ENUMERATING ) { 
remember (old_ref); 


} 
*slot = new_ref; 
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与 SATB 基于 楷 位 写 屏 障 ( 代码 如 下 ) AR, 并 发 枚 举 写 屏 障 不 检查 旧 的 被 引用 对 象 是 否 
已 被 标记 ， 因 为 堆 追 踪 还 没有 开始 。 这 也 是 它 被 命名 为 write_barrier_enum only |() 
的 原因 。 它 只 检查 枚 举 是 否 已 经 开始 。 后面 的 章节 中 会 讨论 堆 追 踪 已 经 开始 的 情况 。 
write barrier slot (Object* src, Object** slot, Object* new_ref) 
{ 

ord -ref = *slot; 

if( !is marked(old ref) ) { 

remember (old_ref) ; 

} 

*slot = new_ref; 
} 


用 三 色 术 语 表 述 ， 记 忆 一 个 引用 就 是 把 这 个 对 象 标 记 为 灰色 。 如 果 可 能 的 话 ，GC 应 该 
避免 多 次 记忆 同一 个 引用 。 


情况 2: 对 象 X 的 引用 在 一 个 全 局 变量 中 ， 现 在 只 存在 于 修改 器 X 的 上 下 文中 

在 GC 扫描 这 个 全 局 变量 之 前 ， 它 被 另 一 个 值 履 盖 了 。 这 个 引用 可 以 像 在 堆 中 一 样 ， 通 
过 监测 全 局 变量 中 的 旧 值 捕获 。 

情况 3: 对 人 象 义 的 引用 在 另 一 个 修改 器 N 的 上 下 文 ( 栈 或 寄存 器 ) 中 , 现在 只 存在 于 修 
改 器 M 的 上 下 文中 。 


在 取得 这 个 修改 器 N 的 根 集 快照 之 前 ， 修 改 器 N 从 它 的 上 下 文中 移 除 了 引用 X BA 
Java 不 允许 一 个 修改 器 直接 写 另 一 个 修改 器 的 栈 ， 所 以 在 修改 器 M 能 够 读 取 并 把 它 写 
入 自己 的 栈 中 之 前 ， 这 个 引用 一 定 被 写 入 到 堆 或 者 全 局 对 象 中 。 

如 果 引 用 X 使 用 堆 作 为 中 转 站 ， 那 么 它 是 一 个 写 入 堆 的 新 引用 值 ， 不 能 被 只 捕获 旧 值 
的 SATB 基于 槽 位 的 写 屏 障 捕 获 。 但 如 果 引 用 和 X 还 在 堆 中 就 没有 问题 ,那样 它 会 被 堆 追 
踪 扫 描 ， 因 为 它 是 活跃 的 。 

如 果 和 包含 义 的 对 象 变 为 不 可 达 (或 者 包含 义 的 字段 被 覆盖 ) 并 且 M 栈 中 的 引用 是 义 的 
唯一 副本 ,也 没有 问题 ， 因 为 如 果 写 屏障 是 原子 的 ,被 覆盖 的 引用 总 是 可 以 被 写 屏障 作 
为 旧 值 捕获 。 

问题 是 基于 槽 位 的 写 屏障 并 不 是 原子 操作 。 当 两 个 修改 器 N 和 了 写 同 一 个 对 象 字 段 时 ， 
它们 的 写 屏 障 代码 可 能 交错 执行 ， 如 图 16-9 所 示 。 
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修改 器 N: 


修改 器 M: 修改 器 P: 
old ref = *slot; Lz 
if (IS_ENUMERATING ) { old_ref = *slot; 
remember (old_ref) ; if ( IS_ENUMERATING ) { 


} 


ae 


remember (old_ref) ; 


*slot = new refl; 


avar = *slot; Bs 


*slot = new ref2; 








图 16-9 一 个 引用 被 写 屏障 遗漏 的 将 态 条 件 


修改 器 N 和 修改 器 P 在 语句 1 中 都 读 到 同样 的 旧 值 ， 然 后 在 语句 2 中 写 入 不 同 的 新 值 。 
可 能 出 现 这 样 的 情况 : 修改 器 N 把 引用 X 作 为 新 引用 写 入 ， 然 后 修改 器 M 从 堆 中 读 取 
引用 义 ， 然 后 把 它 写 入 M 的 栈 中 。 然 后 修改 器 了 在 同一 个 字段 写 入 另 一 个 新 值 覆 盖 X. 


在 这 个 场景 中 ,修改 器 M 在 它 的 栈 中 安装 了 引用 X (BP new_ref), m5 HM Rite 
old_ref 


要 避免 这 个 问题 ， 并 发 枚 举 中 的 写 屏 障 应 该 像 在 INC 写 屏 障 中 一 样 记忆 新 引用 ，。 伪 代 
码 如 下 所 示 。 


write barrier enum race(Object* src, Object** slot, Object* new ref) 
{ 
oid ref = *sloet; 
if( IS_ENUMERATING ) { 
remember (old_ref) ; 
remember (new_ref) ; 
} 
*slot = new_ref; 


} 

使 用 这 个 新 写 屏 障 的 关键 原因 是 ， 多 线程 执行 中 的 堆 字段 写 没 有 严格 的 “新 "“ 旧 ” 顺 
序 。 这 与 SATB 写 屏 障 中 是 不 同 的 ， 其 中 的 “ 旧 值 ”是 由 快照 精确 定义 的 。 这 里 “ 旧 值 ” 
由 堆 写 顺序 定义 : 一 个 槽 位 中 任何 被 覆盖 的 值 都 被 看 作 “ 旧 值 "。 基 于 对 象 的 SATB 5 
屏障 也 不 满足 这 个 需求 ,因为 它 只 记忆 一 个 对 象 中 第 一 次 被 覆盖 的 值 ， 而 我 们 需要 在 每 
次 禾 盖 发 生 时 记忆 旧 值 。 

当 两 个 修改 器 写 同 一 个 楼 位 的 时 候 , 会 发 生 图 16-9 中 描述 的 问题 。 在 无 竞争 的 应 用 程序 
中 ， 这 个 问题 永远 不 会 出 现 

使 用 write_barrier_enum_race， 记 忆 集 基本 上 包含 了 所 有 修改 器 在 根 集 枚 举 过 程 
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中 的 所 有 堆 中 引用 写 操作 。 它 的 目的 是 在 完整 根 集 枚 举 完成 后 ,记忆 堆 中 所 有 因 被 履 盖 

而 消失 的 引用 。 根 集 枚 举 结 束 后 最 终 留 下 的 引用 值 不 需要 记忆 ,因为 它们 可 以 被 根 集 枚 

举 之 后 的 追踪 过 程 扫描 到 。 

对 全 局 变量 也 应 该 应 用 这 个 规则 

情况 4: 对 象 义 是 修改 器 M 创建 的 一 个 新 对 象 ， 它 的 引用 现在 只 存在 于 修改 器 M 的 上 

下 文中 。 

M 在 创建 这 个 对 象 之 后 直接 在 它 的 上 下 文中 写 入 引用 X。 如 果 记 忆 新 对 象 分 配 的 话 ,， 这 

个 引用 会 被 捕获 。 

基于 前 面 的 讨论 ， 并 发 枚 举 是 可 能 的 。 如 果 在 对 象 写 中 没有 竞 态 条 件 的 话 ， 也 就 是 说 ， 写 屏 
障 的 执行 对 于 彼此 是 原子 的 (或 者 说 非 交 错 的 ) 时 候 , 写 屏障 只 需要 记忆 被 覆盖 的 值 。 否 则 ,新 
值 和 旧 值 都 应 该 被 记忆 。 

为 了 开始 追踪 过 程 ，GC 把 所 有 根 集 和 写 屏障 捕获 的 记忆 集合 在 一 起 ， 作 为 “ 根 集 的 完备 快 
照 ”， 然 后 使 用 任意 的 堆 追 踪 算 法 ， 从 它 开 始 遍 历 堆 。 


16.3.2 ”在 根 集 枚 举 过 程 中 追踪 堆 


如 果 第 一 个 修改 器 根 集 可 用 时 ，GC 就 开始 遍历 对 象 邻接 图 ， 不 等 待 所 有 修改 器 的 根 集 都 准 
备 好 ， 那 么 写 屏 障 设 计 还 需要 多 考虑 一 种 情况 。 

情况 5: 对 象 义 的 引用 不 是 写 入 一 个 已 经 枚 举 的 栈 ( 黑色 栈 ) 而 是 写 入 一 个 已 标记 对 象 

(ZIA) 


在 所 有 根 集 都 可 用 之 前 ， 对 象 邻 接 图 的 一 部 分 已 经 被 标记 过 ( 即 图 16-10 中 的 AG )。 这 
种 情况 类 似 于 我 们 在 INC 并 发 追踪 讨论 过 的 : 在 并 发 根 集 枚 举 过 程 中 ， 一 个 白 对 象 的 
引用 被 写 入 一 个 黑 对 象 ， 同 时 从 它 原来 的 (一 条 或 多 条 ) 可 达 路 径 中 被 移 除 。 区别 在 于 ， 
在 INC 讨 论 中 ， 到 达 一 个 白 对 象 的 可 达 路 径 一 定 通过 一 个 边界 对 象 ( 灰 对 象 ); 现在 使 
用 并 发 枚 举 ， 可 达 路 径 也 可 能 来 自 未 被 枚 举 的 栈 ( 阴影 灰 )， 就 如 图 16-10 中 的 对 象 X。 
只 记忆 堆 中 的 旧 引 用 是 不 足以 捕获 这 种 情况 的 ， 因 为 这 里 被 移 除 的 旧 引 用 只 存在 于 栈 中 。 





ta 


图 16-10 枚 举 和 追踪 并 行 的 时 候 可 能 丢失 的 对 象 
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为 了 避免 丢失 这 个 对 象 ， 需 要 一 个 针对 堆 写 和 人 的 INC 写 屏障 ， 记 忆 安 装 到 已 标记 对 象 中 的 
新 引用 。 与 上 面 各 种 情况 的 需求 合并 到 一 起 , 写 屏障 需 要 是 一 个 INC ( 针对 情况 5 ) 和 SATB ( 针 
对 情况 1 ) 的 合并 ， 也 就 是 说 ， 旧 引用 和 新 引用 它 都 应 该 记忆 。 也 就 是 
write_barrier_enum(Object* src, Object** slot, Object* new_ref) 
{ 
old_ref = *slot; 
if( IS_ENUMERATING ) { 
remember (old_ref); 
remember (new_ref) ; 


} 


*slot = new_ref; 





} 

这 个 写 屏 障 与 针对 情况 3 的 那个 (write_barrier_enum_race ) 相同 , 但 背后 的 原因 不 同 。 
现在 情况 5 包含 INC 写 屏障 的 原因 是 , 并 发 根 集 枚 举 并 没有 所 有 根 集 的 全 局 快照 。 换 句 话 说 , 它 
并 不 原子 地 拍摄 全 局 根 集 快 照 ， 而 是 分 别 拍摄 每 个 修改 器 的 根 集 快 照 。 不 同 的 修改 顺 根 集 ( 即 阴 
影 灰 对 象 ) 分 别 被 扫描 ( 即 标记 为 黑色 )， 这 是 一 个 递增 过 程 。 

因此 ， 如 果 GC 从 一 个 修改 器 的 根 集 就 开始 追踪 ， 那么 是 没有 有 效 定 义 的 全 局 对 象 邻 接 图 
“快照 ”的 。 回 收 需 只 能 “递增 地 ”标记 对 象 邻接 图 ， 因 此 需要 INC 写 屏 障 。 

总 结 一 下 ，write_barrier_enum_race 想 要 捕获 对 象 被 扫描 之 前 的 所 有 写 和 引用， 除了 
最 终 的 那些 (那些 保持 活跃 的 )， 而 write_barrier_enum 只 想 要 捕获 对 象 被 扫描 之 后 被 写 人 
的 引用 的 最 终 值 ( 以 免 可 能 丢失 的 )。 它 们 的 代码 看 起 来 一 样 ， 是 因为 在 所 有 根 集 枚 举 之 前 ， 写 
屏障 无 法 知道 何 时 为 对 一 个 覃 位 的 “最 终 ” 写 人 。 尽 管 代码 可 能 看 起 来 相同 ,但 是 它们 的 目的 是 
不 同 的 。 

在 某 些 GC 文献 中 , 根 集 枚 举 阶段 被 称 为 “标记 ”阶段 ， 而 活跃 对 象 标记 阶段 被 称 为 “追踪 ” 
阶段 。 在 另 一 些 文献 中 , 标记 阶段 包含 根 集 枚 举 和 活跃 对 象 标记 。 像 在 情况 5 中 那样 允许 根 集 枚 
举 和 堆 追 踪 并 发 执行 的 情况 下 , 根 集 枚 举 和 堆 追 踪 之 间 没 有 清晰 的 边界 , 用 标记 阶段 来 包含 二 者 
是 很 方便 的 。 在 我 们 的 文字 中 没有 严格 定义 这 些 术语 的 使 用 , 而 是 在 使 用 上 下 文中 澄清 这 些 术 语 
的 实际 含义 。 

有 一 些 来 自 社区 的 并 发 根 集 枚 举 实现 可 用 。 当 与 并 发 堆 追 踪 一 起 应 用 的 时 候 , 这 个 设计 在 广 
献 中 被 称 为 on-the-fly GC 或 者 滑动 视角 GC. 


16.3.3 ”并 发 栈 扫描 
并 发 根 集 枚 举 分 别处 理 每 个 修改 器 的 根 集 ， 而 不 是 像 在 STW 设计 中 原子 化 地 处 理 所 有 修改 
器 。 并 发 根 集 枚 举 的 粒度 是 单个 修改 器 的 执行 上 下 文 。 实 际 上 ， 这 个 粒度 甚至 可 以 更 细 。 


一 个 修改 器 的 根 集 位 于 它 的 运行 时 栈 和 局 部 寄存 器 中 。 在 Java 语义 中 ， 一 个 修改 如 只 对 栈 
的 顶层 帧 和 寄存 器 活跃 操作 。 栈 帧 的 其 余部 分 是 稳定 的 。 基 于 这 个 观察 结果 ,有 可 能 在 枚 举 过 程 
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中 独立 处 理 栈 帧 。 例 如 ， 回 收 器 可 以 从 栈 底 向 上 枚 举 栈 ,直到 遇 到 修改 器 活跃 操作 的 顶层 帧 。 项 
层 帧 和 寄存 器 将 由 修改 器 亲自 枚 举 。 有 既然 目的 是 拥有 一 个 栈 的 快照 , 当 修 改 融 完成 项 层 帧 枚 举 后 ， 
与 回收 器 的 帧 枚 举 结果 合 在 一 起 就 得 到 了 这 个 快照 。 在 这 个 设计 中 , 修改 关中 断 执行 是 为 了 枚 举 
顶层 帧 和 寄存 器 ,其 时 长 可 能 比 枚 举 整个 栈 更 短 。 其 他 解决 方案 则 提出 了 从 上 到 下 方向 枚 举 栈 的 
方法 。 

既然 修改 器 持续 在 栈 上 操作 ， 那 么 并 发 栈 枚 举 的 关键 就 是 同步 修改 器 与 回收 器 之 间 的 操作 。 
一 个 解决 方案 是 保护 栈 上 的 内 存 页 ,除了 栈 顶 所 在 的 第 一 个 页 。 回 收 融 可 以 处 理 内 存 保护 的 栈 页 
面 ， 而 无 须 担 心 与 修改 器 执行 的 竞争 。 每 当 发 生 一 次 修改 带 对 被 保护 页 的 写 入 ， 就 会 陷入 页 面 异 
常 , 然后 异常 处 理 函数 可 以 扫描 这 个 异常 页 面 所 在 的 帧 。 这 个 解决 方案 实际 上 就 是 对 栈 访问 安装 
了 一 个 写 屏障 。 

男 一 个 解决 方案 是 使 用 “返回 屏障 ”。“ 返 回 屏障 ”是 一 段 VM 代码 ,由 修改 天 在 从 一 个 方法 
返回 到 调用 方法 时 执行 。 在 机 器 码 中 , 返回 地 址 是 调用 方法 中 在 修改 器 返回 之 后 第 一 条 执行 的 指 
令 。 返 回 地 址 通常 存储 在 栈 上 作为 返回 指令 的 参数 ,返回 屏障 用 它 的 入 口 点 蔡 换 栈 上 的 返回 地 址 ， 
这 样 当 方法 返回 时 , 控制 流 进入 返回 屏障 代码 。 返回 屏障 在 自己 的 上 下 文中 保存 了 原来 的 返回 地 
址 。 当 它 返 回 时 ， 控 制 流 回 到 调用 方法 中 原来 的 返回 目标 。 


返回 屏障 通常 在 运行 时 安装 到 栈 上 , 这 样 它 只 会 在 必要 时 影响 运行 。 第 一 个 返回 屏障 可 以 由 
修改 咒 安 装 ， 因 为 只 有 它 对 于 栈 有 一 个 稳定 的 视角 。 要 实现 这 一 点 ， 回 收 顷 可 以 设置 一 个 标志 。 


修改 器 在 它 的 GC 安全 点 检查 到 这 个 标志 之 后 ， 就 会 知道 回收 费 需 要 安装 一 个 返回 屏障 ,然后 修 
改 融 就 安装 一 个 。 


16.4 并 发 回收 调度 


一 旦 所 有 修改 器 的 根 集 都 被 枚 举 ，GC 就 继续 执行 堆 追 踪 阶 段 。 堆 追踪 可 能 在 获得 所 有 根 集 
之 前 就 已 经 开始 了 。 


16.4.1 调度 并 发 根 集 枚 举 


堆 追 踪 的 起 始 引 用 集合 是 “ 根 集 完备 视图 ”"， 包括 并 发 根 集 枚 举 获 得 的 所 有 根 集 和 记忆 集 。 
与 通过 STW 枚 举 获得 的 根 集 的 区 别 是 ， 根 集 完备 视图 可 能 包含 过 期 的 引用 ， 因 此 保留 了 漂浮 
垃圾 。 

GC 可 以 使 用 这 个 完备 视图 作为 任何 回收 算法 的 起 始 集合 , 即使 是 STW 算法 也 可 以 。 也 就 是 
说 ， 在 所 有 修改 器 的 并 发 根 集 枚 举 完 成 之 后 ， 可 以 启动 一 个 STW 算法 。 根 据 设 计 的 不 同 ， 这 个 
STW 算法 可 以 是 移动 式 的 或 非 移 动 式 的 ， 并 行 的 ， 或 顺序 的 。 这 个 过 程 如 图 16-11 所 示 。 
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完整 回收 过 程 
图 16-11 并 发 根 集 枚 举 和 停止 世界 ( STW ) 回收 


修改 融和 GC 之 间 的 交互 需要 同步 协议 或 握手 。 
GC 中 的 伪 代 码 如 下 所 示 。 全 局 标志 gc_phase 和 线程 局 部 标志 enumeration_done 是 交 
互 标志 。 


void garbage_collection() { 
// GC 从 根 集 枚 举 启 动 新 一 轮回 收 
// GC 打开 枚 举 写 屏 障 代 码 
gc phase = IS ENUMERATING; 
// GC 等 待 所 有 修改 器 枚 举 完成 
for (every mutator 七 ) { 

while( !t->enumeration done ) 
thread_yield(); 

} 
// 所 有 修改 器 暂停 自身 
// GC 关闭 枚 举 写 屏障 代码 
gc_phase = IS_TRACING; 
gc_stw_collection(); 
// GC 完成 回收 
gc_phase = IS_IDLE; 
gc_resume_mutators(); 

} 


在 修改 器 到 达 一 个 GC 安全 点 之 前 ， 它 按期 望 的 那样 执行 写 屏 障 。 当 到 达 安 全 点 后 ， 修 改 器 
枚 举 它 的 根 集 ， 并 为 STW 回收 暂停 自身 。 修 改 器 的 GC 安全 点 伪 代 码 如 下 所 示 : 


void vm_safepoint () { 

VM_Thread* self = current_thread(); 

// 修改 器 检查 是 否 到 了 根 集 枚 举 的 时 间 

if( gc_phase == IS_ENUMERATING ){ 
// 修改 器 枚 举 它 的 根 集 并 报告 给 GC 
mutator_enumerate_rootset(); 
self->enumeration_done = TRUE; 
// 修改 器 暂停 自身 等 待 GC 恢复 


mutator suspend(); 
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self->enumeration done = FALSE; 

} 

在 实际 的 实现 中 , 根 集 枚 举 之 后 接着 并 发 追踪 是 很 常见 的 , 并 发 追踪 可 以 是 单纯 的 活跃 对 象 
标记 阶段 ， 也 可 以 包含 对 象 移动 。 本 章 关 注 非 移动 式 GC， 把 对 象 移动 的 情况 留 到 下 一 章 。 
16.4.2 调度 并 发 堆 追 踪 

为 了 连接 并 发 根 集 枚 举 和 并 发 堆 妃 踪 , 修改 天 在 枚 举 根 集 之 后 不 需要 和 暂停 自身 。 在 并 发 追踪 
之 后 ,修改 需 可 能 会 暂停 ， 比 如 为 了 并 行 压缩 ， 或 者 修改 咒 本 号 也 可 以 继续 执行 并 发 清除 阶段 来 
完成 一 次 完整 并 发 回收 。 

并 发 扒 追 踪 的 回收 过 程 可 能 如 图 16-12 所 示 ， 其 中 使 用 了 一 个 STW 回收 阶段 。 
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图 16-12 FFARR BCE SHEE ER 


要 用 并 发 枚 举 和 并 发 追踪 实现 回收 , 写 屏障 需要 支持 这 两 者 ,下 面 的 伪 代 码 给 出 了 回收 代码 、 
WEB ai GC 安全 点 和 写 屏 障 的 一 个 框架 。 


回收 代码 使 用 一 个 回收 阶段 标志 ( 包括 它 的 全 局 和 线程 局 部 变量 ) 来 指示 阶段 ,也 用 于 线程 
XH- PKŠ gc_wait_mutators () 等 待 所 有 修改 器 到 达 同 一 个 回收 全 局 阶段 ， 作 为 继续 前 行 之 
前 的 一 个 屏障 。 


void garbage_collection() 

{ 
// GC 从 根 集 枚 举 启 动 新 一 轮回 收 
// GC 打开 并 发 枚 举 写 屏障 代码 
global_gc_phase = IS_ENUMERATING; 
gc_wait_mutators(); 
// 所 有 修改 器 都 已 经 完成 根 集 枚 举 
// GC 打开 并 发 标记 写 屏 障 代码 
global_gc_phase = IS_TRACING; 
gc_trace_heap(); 
// GC 完成 追踪 ， 开 始 回收 
global_gc_phase = IS_RECYCLING; 
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gc wait mutators(); 

// 所 有 修改 器 被 暂停 
gc_stw_collection(); 

// GC 完成 回收 
global_gc_phase = IS_IDLE; 
gc_resume_mutators() ; 


} 


被 修改 器 调用 的 GC 安全 点 代码 实现 了 修改 器 和 回收 器 之 间 的 握手 协议 , 包括 回收 阶段 标志 
设置 ， 以 及 其 他 所 需 操 作 ， 比 如 根 集 枚 举 和 线程 暂停 。 
void vm_safepoint () 
{ 
VM_Thread* self = current_thread(); 
// 修改 器 检查 全 局 GC 阶段 是 否 改变 
if( global_gc_phase != self->gc_phase ) { 

if (global_gc_phase == IS_ENUMERATING) { 
mutator_enumerate_rootset (); 

}else if (global_gc_phase == IS_RECYCLING) { 
self->gc_phase = global_gc_phase; 
mutator_suspend() ; 

} 


self->gc_phase = global_gc_phase; 
} 


写 屏障 代码 支持 并 发 根 集 枚 举 和 SATB 追踪 。 它 检查 回收 阶段 标志 。 如 果 是 在 枚 举 阶段 ， 写 
屏障 记忆 旧 值 和 新 值 。 如 果 在 追踪 阶段 ， 写 屏障 只 记忆 旧 值 。 这 个 设计 的 要 点 在 于 ， 当 回收 从 枚 
举 阶 段 转 换 到 追踪 阶段 之 后 , 所 有 修改 玫 的 根 集 枚 举 都 已 完成 , 所 以 写 屏障 不 会 遗漏 任何 只 在 枚 
举 阶段 被 记忆 的 新 引用 。 

void write_barrier_enum_slot (Object* src, Object** slot, Object* new_ref) 

{ 


old_ref = *slot; 

if( gc_global_phase == IS_ENUMERATING ) { 
remember (old_ref) ; 
remember (new_ref) ; 

}else if( gc_global_phase == IS_TRACING ) { 
remember (old_ref) ; 

} 


*slot = new_ref; 
} 
当 堆 追踪 开始 之 后 , 在 记忆 一 个 被 引用 对 象 之 前 检查 它 是 否 已 被 标记 是 很 好 的 , 这 样 可 以 降 
低 记 忆 的 引用 数量 。 用 三 色 术 语 表 述 ， 当 一 个 对 象 被 扫描 后 ， 它 是 黑色 的 。 如 果 它 被 记忆 了 (或 
者 被 压 入 标记 栈 )， 它 是 灰色 的 。 否 则 ， 它 就 是 白色 的 。 写 屏障 并 不 想 记忆 已 经 被 扫描 或 者 被 记 
忆 的 对 象 。 所 以 图 数 remember () 可 以 用 如 下 代码 实现 : 


void remember (Object* src) 
{ 
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if( obj_is_white(src) ) { 
enqueue (src); 
obj_set_gray (src); 


} 
写 屏障 代码 可 以 被 重新 组 织 为 如 下 代码 ， 其 中 旧 值 和 新 值 会 在 不 同情 况 下 被 记忆 。 
void write_barrier_enum_slot (Object* src, Object** slot, Object* new_ref) 


{ 
Old ref = *slot: 
if( gc_global_phase == IS_ENUMERATING | | 
gc_global_phase == IS_TRACING) { 
remember (old_ref) ; 
} 


if( gc_global_phase == IS_ENUMERATING ) { 
remember (new_ref) ; 


} 
‘Slot = mew ret; 
} 
根据 这 个 新 代码 组 织 , 为 了 同样 的 目标 , 上面 基 于 覃 位 的 写 屏障 可 以 被 蔡 换 为 基于 对 象 的 写 
屏障 。 


void write_barrier_enum_object (Object* src, Object** slot, Object* new_ref) 
{ 


if( gc_global_phase == IS_ENUMERATING | | 
gc_global_phase == IS_TRACING) { 
if( !is_marked(src) && is_clean(src) ) { 


remember (snapshot of src); // 记 住 所 有 引用 
dirty (sire) s 


} 


if( gc_global_phase == IS_ENUMERATING ) { 
remember (new_ref) ; 


上 面 这 个 写 屏障 只 支持 SATB 追踪 。 为 了 支持 INC 追踪 , 写 屏障 应 该 记忆 新 引用 值 或 者 把 修 
改过 的 对 象 标记 为 脏 的 ， 以 供 GC 重新 扫描 。 这 里 我 们 就 不 给 出 细节 了 。 
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上 面 给 出 的 逻辑 可 以 扩展 到 支持 各 种 并 发 GC 设计, 但 它 没有 提 到 如 何 触发 回收 。 一 个 普遍 
的 观点 是 VM 应 该 尽 可 能 少 触发 GC， 因 为 回收 会 消耗 像 处 理 器 周期 和 内 存 这 样 的 系统 资源 。 即 
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使 是 系统 中 有 足够 的 空闲 中 央 处 理 器 (CPU ) 和 动态 随机 访问 存储 ( DRAM )， 由 于 修改 器 执行 
的 GC 安全 点 、 写 屏障 、 读 屏障 、 返 回 屏障 、 与 回收 器 同步 等 操作 ，GC 仍然 会 影响 修改 器 的 执 
行 。 有 一 些 研究 工作 试图 把 GC 转化 为 有 益 于 应 用 程序 的 执行 ， 而 不 仅仅 是 消耗 ， 比 如 ， 通 过 在 
回收 中 布局 活跃 对 象 提高 数据 局 部 性 。 但 总 体 来 说 ，GC 仍然 是 为 获得 更 好 的 安全 性 、 可 移植 性 
和 生产 效率 要 付出 的 代价 。 出 于 这 个 原因 ，VM 希望 尽 可 能 晚 地 触发 一 次 回收 。 


男 一 方面 , 回收 可 能 并 不 想 被 太 晚 触发 。 一 个 原因 是 , 就 像 我 们 在 自 适 应 回收 中 讨论 的 一 
有 时 候 更 早 触 发 回收 可 以 获得 更 好 的 吞吐 量 或 更 短 的 暂停 时 间 。 还 有 一 个 只 eb 
因 ， 其 中 修改 器 与 回收 并 行 执 行 。 在 这 种 情况 下 ， 新 对 象 一 直 在 被 生成 并 消耗 堆 空间 。 可 能 在 并 
发 回收 收回 足够 空间 用 于 修改 天 的 对 象 分 配 之 前 , 堆 就 满 了 。 然后 修改 器 就 需 要 阻塞 等 待 回收 释 
放 足 够 空间 。 其 后 果 就 是 把 并 发 回收 变 成 了 一 次 STW 回收 ， 这 就 违背 了 设计 的 初衷 。 


在 理想 的 情况 下 ， rp 当 它 完成 识别 所 有 死亡 对 象 时 ,分 配 空间 变 满 。 
意味 着 ， 就 在 修改 融 由 于 缺乏 空闲 空间 而 无 法 分 配 新 对 象 之 前 ，GC 能 够 找到 新 的 空闲 空间 。 


假定 回收 时 间 是 Time_collection， 修 改 器 分 配对 象 的 速度 是 Rate_allocation， 那 么 
回收 过 程 中 分 配对 象 的 总 大 小 是 
Size_allocation = Time_collection * Rate_allocation 
这 意味 着 ,如 果 修 改 器 不 想 由 于 用 尽 空闲 空间 而 暂停 的 话 ， 就 需要 在 空闲 空间 仍然 大 于 或 者 等 于 
Size_allocation 的 时 候 启 动 回收 。 


回收 通常 由 修改 器 在 它 分 配 新 对 象 的 时 候 触 发 , 因为 只 有 新 对 象 分 配 会 改变 堆 消 耗 状 态 。 在 
STW 配置 中 ， 修 改 顺 只 需要 在 它 分 配对 象 失 败 的 时 候 触 发 一 次 回收 。 对 于 并 发 回收 ， 修 改 需 可 
能 在 空闲 空间 不 小 于 size_allocation 的 时 候 触发 一 次 回收 。 


如 果 每 次 分 配 都 要 计算 空闲 空间 大 小 的 话 , 代价 可 能 比较 昂贵 , 特别 是 当 有 很 多 修改 器 的 时 
候 。 男 一 个 方法 是 估计 启动 回收 的 时 间 点 。 假设 当前 空闲 空间 大 小 是 Size_current_free, 修 
改 融 应 该 在 时 间 Az 后 开始 回收 : 


AT = (Size_current_free - Size_allocation) /Rate_allocation 


为 了 避免 不 精确 的 预测 , MB Ca AT WA Ra A as PAS, FR II E 
AT /2 时 间 后 再 次 执行 预测 。 





16.4.4 并 发 回收 阶段 转换 

如 果 有 多 个 修改 器 , 它们 可 能 同时 触发 回收 。 需 要 同步 来 确保 只 有 一 个 修改 器 触发 回收 。 一 
个 实际 的 GC 实现 可 能 有 多 个 回收 器 ， 可 以 按 需 并 行 工作 。 这 里 “ 按 需 ”的 意思 是 ， 被 激活 的 回 
收 器 数量 可 以 动态 改变 , 以 满足 回收 需要 。 比 如 , 如果 分 配 率 变 高 , 就 需要 更 多 的 回收 器 来 追 上 。 
另 一 方面 ， 如 果 分 配 率 变 低 ， 就 使 用 更 少 的 回收 器 以 降低 系统 负担 。 

为 了 协调 多 个 回收 器 和 修改 器 的 操作 , 修改 器 不 仅 需要 和 触发 回收 , 还 会 陷入 回收 调度 器 进行 
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阶段 转换 调度 。 因 此 ， 伪 代码 可 能 是 如 下 所 示 的 。 


Object_header* gc_mutator_alloc(int size, Vtable_header* vt) 
{ 
// 检查 下 一 次 回收 的 期 望 类 型 
if( collection_is_concurrent() Yt 
gc_schedule_collection(); 
} 
// 普通 分 配 逻 辑 


void gc_schedule_collection() 
{ 
switch (global_gc_phase) { 
case GC_IDLE: 

bool should_start = gë check start conditioni); 
if( !should_start ) return FALSE; 
// 所 有 试图 切换 阶段 的 修改 器 ， 只 有 一 个 能 胜利 
bool state = gc_phase_transition(GC_ENUM_START) ; 
if( !state ) return; 
// 只 有 一 个 修改 器 来 到 这 里 
gc_start_enum(); // 安装 写 屏 障 和 枚 举 函 数 


break; 





GJ 


case GC_ENUM_DONE: 
bool state = gc_phase_transition(GC_TRACE START) ; 
if( !state ) return; 
// 只 有 一 个 修改 器 来 到 这 里 
gc_start_trace(); // 启动 多 个 回收 器 
break; 





case GC_TRACE_DONE: 
bool state = gc_phase_transition(GC_SWEEP_START) ; 
if( !state ) return; 
// 只 有 一 个 修改 器 来 到 这 里 
gc_start_sweep(); // 触发 情 性 清除 或 开始 清除 


break; 


// 其 他 状态 转换 
} // 切换 结束 


bool gc_phase_transition(GC_Phase next) 

{ 
GC_Phase old = global_gc_phase; 
GC_Phase curr = CompareExchange(&global_gce_phase, old, next); 
return (old == curr); 


} 
在 这 个 设计 中 , EAE aie AB AT IE BE A DL Ce SE ae CS BS Ag MBE aK AR AS 


274 第 16 章 ”针对 响应 性 的 GC 优化 


转换 ， 并 执行 相应 的 前 操作 和 后 操作 。 比 如 ， 当 全 局 GC 阶段 到 达 Gc_ENUM_DONE 之 后 ， 一 个 
修改 器 会 把 阶段 转换 为 GC_TRACE_START， 然 后 按 需 启动 多 个 回收 器 用 于 并 发 堆 追 踪 。 所 有 回 
收 需 都 由 调度 器 启动 , 并 且 它 们 彼此 同步 来 完成 被 分 配 的 任务 。 当 它们 完成 这 些 任 务 之 后 ,全 局 
GC 状态 变 为 下 一 阶段 。 

基于 上 面 的 讨论 ， 一 次 完整 并 发 标记 清除 回收 的 工作 流 如 图 16-13 所 示 。 


Bag (EY at 
一 次 完整 回收 zra 回收 器 





空闲 Bee ， 追踪 清除 ER ZA 
图 16-13 一 次 完整 并 发 标记 清除 回收 的 垃圾 回收 ( GC ) 阶段 


图 16-13 中 的 状态 如 下 。 


口 状态 1: 回收 空闲 。 

口 状态 2: 枚 举 。 

口 状态 3: 堆 追 踪 。 

口 状态 4: 堆 清 除 。 

口 状态 5: 回收 整理 了 结 。 


因为 回收 调度 器 不 太 可 能 一 直 避 免 STW 回收 ， 所 以 我 们 还 有 用 于 STW 回收 的 一 个 额外 阶段 。 
口 状态 6: STW 回收 。 
为 了 支持 状态 转换 ， 可 以 定义 下 面 的 阶段 : 


enum GC_Phase{ 
GC_IDLE; 
GC_ENUM_START; 
GC_ENUM_DONE; 
GC_TRACE_START; 
GC_TRACE_DONE; 
GC_SWEEP_START; 
GC_SWEEP_DONE; 
GC_RESET; 
GC_STW 

} 


图 16-14 中 给 出 了 状态 转换 流程 。 既 然 有 多 个 回收 器 ,那么 允许 回收 器 改变 全 局 状态 来 指示 
它们 都 已 经 完成 了 指派 的 工作 是 很 方便 的 。 例 如 ，TRACE_DONE 和 SWEEP_DONE 由 回收 器 转换 
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到 各 自 的 下 一 阶段 。 当 回收 调度 器 检测 到 这 个 改变 时 , 它 再 次 把 阶段 转换 到 下 一 阶段 ,并 且 可 能 
局 动 另 一 轮 的 多 个 回收 器 。 在 回收 器 转换 和 修改 器 转换 之 间 的 这 段 时 间 , 没有 回收 器 运行 。 在 实 


际 的 实现 中 , 这 个 设计 可 能 允许 在 这 个 时 期 有 一 个 回收 器 运行 。 这 有 助 于 为 GC 提供 一 个 进行 单 
线程 操作 的 时 间 段 。 
B 修改 器 





回收 器 





图 16-14 一 次 完整 并 发 标记 清除 回收 中 的 垃圾 回收 ( GC ) 阶段 转换 
有 一 个 状态 没有 展示 在 流程 图 中 ， 就 是 cc_sTw， 这 个 阶段 用 于 STW 回收 。 注 意 ， 即 使 一 
次 回收 作为 并 发 回收 启动 ， 如 果 回 收 无 法 在 堆 空 间 用 尽 之 前 结束 的 话 ， 它 也 可 能 不 得 不 转换 到 
STW 状态 。 男 一 方面 ， 一 个 灵活 的 GC 设计 应 该 允许 用 户 指定 每 个 阶段 是 并 发 的 还 是 STW。 两 
种 情况 下 ,调度 器 都 应 该 能 够 把 回收 切换 为 STW. KI 16-15 中 给 出 了 所 有 阶段 之 间 的 状态 转换 图 。 


LY 


图 16-15 一 个 垃圾 回收 (GC) 设计 中 的 状态 转换 图 
这 些 转换 的 解释 如 下 。 
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D >O 堆 有 足够 空空 间 ， 因 此 不 需要 触发 回收 。 

0 O> 是 触发 一 次 并 发 根 集 枚 举 的 时 间 了 。 

口 O> 是 触发 一 次 STW 回收 的 时 间 了 。 

0 OO 并 发 枚 举 已 经 完成 。 回 收 转换 为 并 发 堆 追 踪 。 

O OSO HER, 或 者 并 发 枚 举 已 完成 ; 回收 转换 为 STW 堆 追 踪 。 
口 OSO 并 发 追踪 已 完成 。 回 收 转换 为 并 发 清除 。 

O OO 并 发 追踪 已 完成 。 回 收 转 换 为 惰性 清除 了 结 整理 。 

0 OSO 并 发 追踪 已 完成 。 回 收 转 换 为 STW 回收 ， 比 如 压缩 。 
O OO 并 发 清除 已 完成 。 回 收 转 换 为 了 结 整 理 。 

O © 一 GC 完成 并 发 回收 ， 回 到 空闲 状态 。 

O @ 一 ID GC 完成 STW 回收 ， 回 到 空闲 状态 。 


并 发 回收 的 终止 过 程 并 不 像 STW 回收 那么 明显 ， 因 为 它 可 能 有 包含 任务 的 多 个 数据 结构 。 
它们 的 所 有 任务 都 应 该 完成 才能 终止 。 实 际 的 设计 依赖 于 这 个 数据 结构 ， 以 及 线程 设计 。 
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我 们 已 经 看 到 了 移动 式 垃圾 回收 CGC) 的 优点 ， 现 在 希望 支持 并 发 移动 式 回收 ， 也 就 是 在 
修改 带 运 行 的 同时 移动 活路 对象。 并 发 对 象 移动 支持 的 挑战 性 主要 在 于 以 下 几 点 。 


O 回收 器 和 修改 器 的 竞争 访问 : 当 一 个 对 象 被 回收 器 移动 的 时 候 ， 它 可 能 被 修改 占 访 问 
需要 有 协议 来 保证 对 象 数据 一 致 性 。 
口 引用 修正 : 一 个 对 象 被 移动 后 ， 可 能 有 引用 指向 它 的 旧 位 置 。 这 些 引 用 应 该 被 修正 为 指 
回 新 位 置 。 
口 终止 : 就 像 在 并 发 堆 追 踪 中 讨论 过 的 一 样 ， 并 发 移动 算法 需要 确保 适时 终止 。 
复制 式 GC 算法 需要 一 些 空闲 空间 ， ee 我 们 称 这 些 空 闲 空间 为 
“目标 空间 ”( to-space )， 称 被 回收 的 空间 为 “ 源 空间 ”( from-space ) a es ee eee 
一 些 空闲 空间 , 也 可 以 在 回收 过 程 中 腾空 SE are 空间 来 产生 空闲 空 si. 举例 来 说 , 半空 间 算法 为 
复制 式 回收 保留 了 半 个 堆 。 就 地 压缩 算法 并 不 保留 空 闪 空间 ,而 是 需要 首先 遍历 堆 来 找到 活跃 对 
象 。 然 后 它 就 知道 要 移入 活跃 对 象 的 空闲 空间 在 哪里 。 本 童 首先 讨论 并 发 复制 式 GC， 然 后 讨论 
并 发 压缩 式 GC。 


17.1 并 发 复制 :“ 目 标 空间 不 变 ” 


根 集 已 知之 后 , 复制 式 回收 开始 把 可 达 对 象 复 制 到 空闲 空间 。 复 制 对 象 之 后 , 在 原来 的 对 象 
头 中 或 目标 表 中 安装 转发 指针 ,用 来 映射 原始 副本 和 新 副本 之 间 的 地 址 。 那 么 , 首先 问题 就 是 如 
何 处 理 根 集 引 用 。 在 停止 世界 ( stop-the-world，STW ) 回收 中 ,在 修改 天 恢复 之 前 ， 所 有 根 引 用 
被 修正 为 指向 新 副本 。 如 果 GC 想 要 在 修改 器 执行 的 同时 并 发 复制 对 象 ， 就 有 一 个 问题 : 修改 天 
应 该 只 能 看 到 新 副本 , 还 是 只 能 看 到 旧 副 本 , 或 者 都 能 看 见 ?” 对 这 个 问题 的 不 同 回答 会 导致 不 同 
的 解决 方案 。 


17.1.1 基于 棋 位 的 “目标 空间 不 变 ” 算 法 
一 个 解决 方案 只 允许 修改 器 看 到 新 副本 ， 称 为 “目标 空间 不 变 ”( to-space invariant ) 算法 。 
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1.“ 目 标 空间 不 变 ” 算 法 的 翻转 阶段 


这 个 设计 中 回收 的 第 一 个 阶段 与 STW 复制 式 回收 类 似 。 也 就 是 说 ， 在 根 集 枚 举 过 程 中 ， 修 
改 帮 是 被 暂停 的 。 所 有 从 根 集 直接 可 达 的 对 象 被 复制 到 “目标 空间 ”， 根 引用 被 更 新 为 指向 新 副 
AS 与 传统 复制 式 回收 不 同 的 是 ， 在 并 发 复制 算法 中 STW 阶段 到 这 里 就 结束 了 。 它 把 系统 留 在 
这 样 一 个 状态 , 就 是 所 有 修改 器 只 能 看 到 目标 空间 中 的 对 象 , 而 其 余 所 有 活跃 对 象 还 在 源 空间 中 。 
堆 对 象 中 所 有 引用 指向 源 空 间 中 的 对 象 , 包括 那些 目标 空间 中 新 副本 的 引用 。 此 时 ,恢复 所 有 修 


改天 并 继续 执行 。 
下 面 给 出 上 述 过 程 的 伪 代 码 。 
void concurrent_copying_to() 
{ 
gc_suspend_mutators(); 
Set* rootset = gc_enumerate_rootset (); 
for( each slot in rootset ) { 
Object* obj = *slot; 
*slot = obj_forward(obj); 
} 


gc_resume_mutators() ; 


// 下 面 的 回收 工作 与 修改 并 行 
ae 
图 17-1 展示 了 这 个 STW 阶段 的 过 程 。 
回收 前 : 






站 活跃 对 象 


i 
己 被 转发 对 象 的 旧 副本 


| 被 转发 对 象 的 新 副本 









z 被 转发 对 象 的 旧 副本 
一 


| ese at taal 








图 17-1 停止 世界 (STW ) 阶段 前 后 的 并 发 复制 式 回 收 
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这 个 过 程 通常 称 为 “翻转 ” 步骤, 因为 它 把 所 有 根 引 用 从 指向 源 空间 翻转 到 了 指向 目标 空间 。 

2.“ 目 标 空间 不 变 ” 算 法 的 复制 阶段 

修改 需 恢 复 运 行 之 后 , 当 修改 器 加 载 目 标 空间 中 一 个 包含 引用 R 的 对 象 字段 F 时 , 它 检查 这 
个 引用 是 否 指向 源 空间 。 检 查 结果 可 能 是 以 下 情况 之 一 。 

情况 1: 如 果 被 引用 对 象 在 源 空 间 中 ， 并 且 已 经 被 复制 到 了 目标 空间 ， 人 和 修改 器 需要 执行 

以 下 步骤 。 

(1) 加 载 转发 指针 P。 

(2) 用 P 替 换 下 中 的 旧 引 用 Ro 

(3) 最 后 ， 在 执行 上 下 文中 用 引用 了 代替 R。 

情况 2: 如 果 被 引用 对 象 在 源 空间 中 ， 还 没有 被 复制 ， 修 改 器 需要 执行 以 下 操作 。 

(D) 把 R 引 用 的 对 象 复制 到 目标 空间 ， 比 如 在 新 位 置 P 

(2) 在 源 空 间 的 旧 副 本 中 安装 转发 指针 了 。 

(3) 用 了 替换 下 中 的 旧 引 用 有。 

(4) 最 后 ， 在 执行 上 下 文中 使 用 引用 了 代替 R。 


情况 3: 如 果 引 用 指向 目标 空间 ， 修 改 器 什么 也 不 做 。 


GC 把 这 些 操作 实现 为 “ 读 屏障 "， 每 当 修改 器 向 自己 的 执行 上 下 文中 加 载 一 个 引用 时 执行 。 
读 屏 障 确保 它 的 上 下 文中 没有 指向 源 空间 的 引用 。 在 引用 被 加 载 到 修改 融 的 上 下 文 之 后 ,修改 天 
就 可 以 读 写 目标 空间 中 的 被 引用 对 象 。 通 过 这 种 方式 ， 这 个 设计 保持 了 “目标 空间 不 变 ” 性 。 这 
个 设计 最 早 由 Baker 提出 ， 很 多 其 他 并 发 移动 算法 都 可 以 追溯 到 他 的 原创 性 工作 。“ 目 标 空间 不 
变 ” 算 法 的 读 屏障 伪 代 码 给 出 如 下 。 

// 加 载 对 象 src 的 slot 中 引用 的 读 屏 障 


Object* read_barrier_slot(Object* src, Object** slot) 
{ 
Object* obj = *slot; 
if( in_from_space(obj) ) { 
if( !is_forwarded(obj) ) { 
obj_forward(obj) ; 
} 
obj = forwarding_pointer(obj); 
*slot = obj; 
} 
return obj; 
} 


当 修改 器 加 载 对 象 src 中 的 引用 字段 slot 内 容 的 时 候 ， 执 行 这 个 读 屏 障 。 对 象 src 位 于 
目标 空间 中 。 这 个 读 屏 障 不 仅 用 于 对 象 数 据 读 操作 ,也 用 于 写 操 作 。 在 某 些 文献 中 ,这 类 屏障 被 
称 为 “加 载 屏障 "， 指 明了 每 当 一 个 引用 被 加 载 到 修改 器 的 执行 空间 时 ， 就 会 执行 此 屏障 这 个 事 
实 。 上 面 的 读 屏障 代码 是 基于 槽 位 的 ， 因 为 它 从 一 个 槽 位 中 加 载 引 用 。 
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如 果 活 跃 对 象 只 被 读 屏障 复制 ， 回 收 可 能 会 执行 太 长 时 间 , 或 者 永远 无 法 终止 。 这 是 因为 有 
些 活跃 对 象 在 回收 开始 很 长 时 间 之 后 才 会 被 修改 器 访问 。 它 们 和 号 个 到 被 复制 到 目标 空 s 间 的 机 会 
既然 根 集 对 GC 来 说 是 已 知 的 ， 回 收 器 可 以 与 修改 器 并 行 地 追踪 所 有 可 达 对 象 ， 并 把 它们 转发 到 
目标 空间 。 


当 修 改 帮 被 恢复 后 , 回收 费 可 以 同时 遍历 堆 并 转发 所 有 引用 。 回 收费 加 载 引 用 的 操作 与 修改 
侣 用 读 屏 障 所 做 的 加 载 引 用 一 样 。 区 别 在 于 ,修改 费 加 载 引 用 是 为 了 程序 执行 ， 而 回收 顷 加 载 引 
用 是 为 了 触发 对 象 转发 或 引用 修正 

如 果 需 要 的 话 ， 修 改天 也 可 以 执行 更 多 回收 工作 。 例 如 ,修改 带 可 以 给 每 次 对 象 分 配 附加 一 
些 对 象 扫描 工作 。 每 个 读 屏 障 也 可 以 把 一 个 指向 未 标记 对 象 的 引用 压 和 人 标记 栈 , 这 样 可 以 加 速 堆 
追踪， 如 以 下 代码 所 示 。 


Object* read_barrier_slot (Object* src, Object** slot) 
{ 
Object* db] = *slot; 
if( in_from_space(obj) ){ 
if( !is_forwarded(obj) ) { 
obj_forward(obj); 
} 
obj = forwarding_pointer (obj); 
alot = pj? 
} 
if( !is_marked(obj) ){ 
remember (obj) ; 
} 
return obj; 


} 


17.1.2 “目标 空间 不 变 ” 性 


与 并 发 堆 追 踪 相 比 ,“ 目 标 空间 不 变 ” 并 发 复制 算法 看 起 来 似乎 与 起 始 快照 ( SATB ) 算法 类 
Wh. 仔细 观察 后 会 发 现 它 们 有 所 不 同 , 因为 “目标 空间 不 变 ” 并 不 像 SATB 一 样 维护 “快照 不 变 ” 
在 SATB 设计 中 ， 需 要 写 屏障 来 记忆 被 覆盖 的 旧 引 用 值 ， 以 此 维护 对 象 邻接 图 的 “快照 ”， Whit 
维护 正确 性 。 原 因 在 于 被 覆盖 的 引用 可 能 指向 一 个 白 对 象 。 在 这 个 引用 被 覆盖 之 后 ， 它 可 能 被 存 
储 在 一 个 黑 对 象 或 者 运行 时 栈 中 ， 不 会 被 再 次 扫描 。 虽然 被 引用 的 对 象 仍然 是 可 达 的 , 但 GCA 
无 法 发 现 它 。 

在 “目标 空间 不 变 ” 复 制式 回收 中 , 目标 空间 中 的 对 象 或 者 是 黑色 的 〈 即 对 象 的 所 有 引用 都 
被 加 载 并 转发 了 ) 或 者 是 灰色 的 ( 即 不 是 它 的 所 有 引用 都 被 转发 了 ), 源 空 间 中 的 对 象 是 白色 的 。: 
每 当 加 载 一 个 对 白 对 象 的 引用 时 ， 这 个 对 象 会 被 转发 ( 即 变 为 灰色 )。 不 可 能 把 指向 日 对 象 的 引 
用 安装 到 一 个 黑 对 象 或 者 运行 时 栈 中 。 换 名 话说， 读 屏障 语义 已 经 确保 了 这 个 设计 的 正确 性 。 

有 人 可 能 会 奇怪 为 什么 在 SATB 和 INC( 增 量 更 新 ) 设 计 中 可 以 向 黑 对 象 中 安装 一 个 白 指针 。 
这 是 因为 它们 不 使 用 读 屏 障 ， 从 而 无 法 捕获 所 有 加 载 的 引用 。 具 体 来 说 ， 只 需 j INTREE, 
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一 个 指向 白 对 象 的 引用 就 可 以 被 修改 器 通过 追踪 引用 链 来 加 载 。 然 后 修改 器 把 这 个 白 指针 安装 到 
它 的 运行 时 栈 或 一 个 黑 对 象 中 。SATB 写 屏障 两 种 情况 都 不 能 捕捉 到 ，INC 写 屏障 无 法 捕捉 写 人 
运行 时 栈 的 情况 。 

造成 这 个 区 别 的 关键 原因 是 ,“ 目 标 空间 不 变 ” 设 计 的 读 屏 障 用 “修改 器 访问 ”来 确定 一 个 
对 象 的 活性 。 被 访问 的 对 象 肯定 是 活跃 的 ， 并且 一 个 活跃 对 象 或 早 或 晚 总 会 被 访问 ( 既然 永远 不 
被 访问 的 对 象 可 以 被 认为 是 死亡 的 )， 这 实际 上 是 一 个 比 可 达 性 更 严格 的 活跃 对 象 定义 。 这 个 读 
屏障 不 依赖 于 单独 的 可 达 性 分 析 , 因此 避免 了 并 发 回收 设计 最 常见 的 问题 , 那 就 是 对 象 邻接 图 处 
于 变化 之 中 。 或 者 换 名 话说， 对 象 邻接 图 的 变化 本 身 就 是 被 修改 器 引入 的 。 修 改 器 的 读 屏障 执行 
和 它 本 身 的 应 用 程序 执行 之 间 没 有 竞 态 条 件 。 在 “目标 空间 不 变 ” 算 法 中 ,可 达 性 分 析 和 对 象 图 
修改 本 质 上 是 相同 的 过 程 。 加 载 的 引用 是 活跃 的 引用 。 复 制 的 对 象 可 能 在 回收 完成 之 前 死 掉 ， 
但 在 被 复制 的 时 候 一 定 是 活跃 的 。 

如 果 在 读 屏 隐 之 外 使 用 并 发 回收 器 的 话 ， 情况 就 有 点 不 同 。 如 果 回 收 需 追踪 堆 ( 因此 转发 可 
达 对 象 ) 比 修改 带 的 访问 更 快 ， 也 就 是 说 ， 回 收回 在 对 象 被 修改 器 访问 之 前 复制 对 象 ， 那么 所 有 
被 复制 的 对 象 和 在 STW 堆 追 踪 标 记 的 那些 都 是 相同 的 。 这 种 情况 下 不 会 丢失 任何 活跃 对 象 ， 不 
过 其 中 一 些 过 一 会 儿 可 能 就 死亡 了 。 

如 果 修改 器 在 回收 融 复 制 某 些 对 象 之 前 访问 它们 , 修改 器 可 能 写 和 它们 并 履 盖 一 些 指向 源 空 
间 中 白 对 象 的 引用 ,这 可 能 会 导致 这 些 白 对 象 中 的 一 部 分 变 得 不 可 达 , 如 果 它 们 没有 别 的 到 达 路 
径 的 话 。 尽 管 它们 是 STW 快照 的 一 部 分 ， 它 们 并 没有 被 转发 ， 因 为 它们 已 经 不 再 活跃 。 修 改 顺 
对 这 些 到 源 空 间 对 象 的 引用 访问 越 快 ( 与 回收 器 追踪 推进 的 速度 相 比 )， 回 收 器 保留 的 漂浮 垃圾 
就 会 越 少 。 

换 句 话说 ， 当 回收 需 向 前 推进 追踪 波 前 的 时 候 ， 修改 器 高 效 地 切断 了 从 波 前 到 达 白 对 象 ( 即 
源 空间 ) 的 一 些 路 径 。 回 收 器 把 当前 的 波 前 〈 即 灰 对 象 ) 作为 当前 “新 根 ”， 并 试图 得 到 一 个 在 


对 象 邻接 图 剩余 部 分 ( 即 源 空间 中 的 对 象 ) 中 从 新 根 出 发 的 快照 ， 如 图 17-2 所 示 。 我 们 把 从 波 
前 可 达 的 快照 称 为 “ 波 前 快照 ”( wave-front snapshot )。 
1. 剩余 快照 2. 修改 器 写 3. 当前 快照 





图 17-2 “目标 空间 不 变 ” 回 收 中 修改 天 与 回收 需 的 合作 


图 17-2 中 ， 打 又 的 箭头 被 修改 器 切断 。 当 前 快照 不 包含 这 些 不 再 可 达 的 白 对 象 ， 尽 管 它们 
在 修改 融 写 操作 之 前 是 波 前 快照 的 一 部 分 。 在 “目标 空间 不 变 ” 回 收 中 ， 随 着 修改 器 运行 ， 当 前 
波 前 快照 变 得 越 来 越 小 。 
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作为 “目标 空间 不 变 ” 的 一 部 分 , 新 对 象 应 该 被 放 在 目标 空间 , 因为 它们 是 修改 天 新 分 配 ( 即 
访问 ) WY. 这 与 SATB 设计 类 似 。 从 男 一 个 角度 看 ,， 有 必要 把 新 对 象 当 作 活 路 的 。 在 极端 情况 下 ， 
我 们 已 经 知道 ,“ 目 标 空间 不 变 ” 设 计 会 得 到 与 STW 快照 相同 的 结果 ,其 中 新 对 象 不 是 对 象 邻接 
图 快照 的 一 部 分 。 新 对 象 不 需要 被 扫描 ， 因 为 任何 写 入 新 对 象 的 引用 一 定 会 被 读 屏 障 捕 获 。 


当 对 比 两 个 对 象 引 用 值 的 等 价 性 的 时 候 , 修改 器 可 以 直接 执行 比较 操作 , 因为 它 只 从 目标 空 
间 加 载 引 用 ， 对 同一 个 对 象 的 引用 总 是 相同 的 。 


对 于 “目标 空间 不 变 ” 设 计 来 说 ， 回 收 终止 不 是 一 个 问题 ， 因 为 回收 开始 的 时 候 源 空间 大 小 
是 固定 的 。 从 图 遍历 的 角度 讲 ， 这 个 回收 收敛 的 速度 比 STW 回收 快 ， 因 为 剩余 快照 单调 变 小 。 


17.1.3 ”对 象 转发 


当 多 个 线程 访问 同一 个 对 象 的 时 候 , 不 管 是 修改 器 还 是 回收 器 ,只 要 复制 只 被 一 个 线程 提交 
就 没有 问题 。 当 一 个 线程 试图 转发 一 个 对 象 , 并 发 现 这 个 对 象 正 在 被 另 一 个 线程 复制 的 时 候 , 它 
会 等 待 复制 结束 ， 然 后 访问 数据 。 下 面 的 伪 代 码 给 出 了 对 象 转发 过 程 。 它 用 原子 操作 确保 只 
个 线程 转发 这 个 对 象 。 修 改 顺 和 回收 器 线程 都 使 用 这 个 例 程 。 


// 对 象 头 中 最 后 两 位 留 作 转发 标志 位 

// 对 象 地 址 总 是 4 对 齐 ( 即 最 后 两 位 总 是 0) 

#define FORWARDING_BIT 0x1 

#define FORWARDED _BIT 0x2 

#define FORWARD_BITS (FORWARDING_BIT | FORWARDED_BIT) 


Object* obj_forward(Object* obj) 
{ 
Obj_header header = obj_header (obj); 
if( !(header & FORWARD_BITS) ) { 
// 对 象 没有 被 转发 ， 也 不 在 转发 中 
// 锁定 对 象 关中 的 FORWARDING_BIT 
bool success = lock_forwarding (obj); 
if( success ){ 
// 成 功 锁定 了 对 象 
// 把 对 象 复制 到 新 地 址 
Object* new = obj_copy(obj); 
// 安装 转发 指针 
header = new | FORWARD_BITS; 
obj_set_header (obj, header); 
unlock_forwarding (obj); 
return new; 
} 
} 
// 被 其 他 线程 转发 或 者 在 转发 之 中 
// 忙 等 复制 完成 
while( !is_forwarded(obj) ) pause(); 
obj = forwarding_pointer (obj); 
return obj; 
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bool is_forwarded(Object* obj) 

{ 
Obj_header header = obj_header (obj); 
return (header & FORWARDED _ BIT); 

} 


Object* forwarding_pointer(Object* obj) 
{ 
Obj_header header = obj_header(obj); 
return (Object*) (header & ~FORWARD_BITS) ; 
} 


bool is_under_forwarding(Object* obj) 

{ 
Obj_header header = obj_header (obj); 
return (header & FORWARDING_BIT) ; 

} 


bool lock_forwarding(Object* obj) 

{ 
Object_header* p_header = obj_header_addr (obj) ; 
// 设置 FORWARDING_BIT {24 1, #34 !original_value 
return atomic_testset (p_header, FORWARDING_BIT) 

} 


void unlock_forwarding(Object* obj) 

{ 
Obj_header header = obj_header(obj) ; 
obj_set_header(obj, header & ~FORWARDING_BIT); 


17.1.4 基于 对 象 的 “目标 空间 不 变 ” 算 法 


在 前 面 基于 槽 位 的 读 屏 障 中 , 它 会 检查 加 被 加 载 的 引用 是 否 在 源 空 间 中 , 但 它 不 检查 包含 这 
个 引用 的 对 象 是 否 已 经 被 扫描 。 如 果 它 已 经 被 扫描 , 那么 它 的 所 有 引用 字段 已 经 被 转发 ， 因 此 不 
需要 进一步 检查 任何 它 包含 的 引用 。 这 要 求 GC 标记 被 扫描 对 象 。 添 加 了 额外 检查 (加 粗 代 码 体 
显示 ) 的 读 屏 障 代 码 如 下 。 

// 加 载 对 象 src slot 中 引用 的 读 屏障 


Object* read_barrier_slot (Object* src, Object** slot) 
{ 
if( is_marked(src) ){ 
return *slot; 


} 
Object* obj = *slot; 
if( in_from_space(obj) ) { 





if( !is_forwarded(obj) ) { 
obj_forward (obj); 

} 

obj = forwarding_pointer (obj); 

*slot = obj; 
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if( !is_marked(obj) ){ 
remember (obj) ; 

} 

return obj; 


} 

使 用 这 个 读 屏障 ， 如 果 回 收 器 运行 更 快 , 在 回收 器 访问 多 数 对 象 之 前 就 标记 了 它们 , 那么 大 
多 数 读 屏障 执行 会 更 轻 量 。 但 是 ， 如 果 回 收 器 运行 更 慢 ， 那 么 额外 的 检查 会 变 得 元 余 ， 因 为 
is_marked(src) 经 常 返回 FALSE。 根 本 原因 是 基于 酸 位 的 读 屏障 每 次 最 多 只 能 更 新 一 个 槽 位 。 
它 不 会 把 对 象 标 记 为 已 扫描 ， 因 为 它 并 不 知道 何 时 一 个 对 象 更 新 了 所 有 的 引用 槽 位 。 换 句 话 说 ， 
基于 槽 位 的 读 屏 障 只 会 把 一 个 对 象 从 白色 变 为 灰色 ,但 永远 不 会 将 其 从 灰色 变 为 黑色 。 


为 了 改进 这 个 设计 ,可 以 把 读 屏障 修改 为 扫描 一 个 对 象 ， 并 转发 它 包含 的 所 有 引用 , 不仅 限 
于 被 加 载 的 引用 。 通 过 这 种 方式 ， 修改 器 可 以 把 一 个 对 象 直接 从 白 变 黑 ， 这 就 标记 了 它 。 那 么 即 
使 回收 器 运行 更 慢 ,， 仍然 有 可 能 is_marked (src) 返 回 TRUE， 从 而 导致 轻 量 的 读 屏 障 执 行 。 基 
于 对 象 的 读 屏 障 的 伪 代 码 如 下 所 示 : 


// 加 载 对 象 src 的 slot 中 引用 的 读 屏障 
Object* read_barrier_object (Object* src, Object** slot) 
{ 
if( is_marked(src) ) { 
return *slot; 
} 
// ÆR $ src MKE 
for (each reference field p_ref of src){ 
Object* ref = *p_ref; 
*p_ref = obj_forward(ref) ; 
} 
mark(src) ; 
return *slot; 


} 

使 用 上 面 基于 对 象 的 读 屏 障 ， 当 修改 器 访问 对 象 src 的 时 候 ， 它 确保 对 象 src 引用 的 所 有 
对 象 变 为 灰色 ， 然 后 标记 对 象 src 为 黑色 。 基 于 槽 位 的 读 屏 障 检查 被 引用 对 象 的 状态 ; 与 此 不 同 
的 是 ， 基 于 对 象 的 读 屏障 检查 包含 这 个 引用 的 被 访问 对 象 的 状态 。 

我 们 已 经 看 到 ， 对 于 “目标 空间 不 变 ” 并 发 复制 式 回 收 来 说 ， 有 两 个 设计 变 体 ， 一 个 使 用 基 
于 覃 位 的 读 屏障 ， 另 一 个 使 用 基于 对 象 的 读 屏障 。 我 们 也 已 经 在 SATB 并 发 标记 算法 ( HEP 
的 写 屏障 与 基于 对 象 的 写 屏障 )、INC 并 发 标记 算法 ( 记忆 引用 写 屏障 与 记忆 根 写 屏障 ) 和 分 代 
式 GC ( 牌 更 与 记忆 集 ) 中 看 到 了 类 似 的 关系 。 青 次 强调 ， 这 两 个 变 体 之 间 没 有 本 质 区 别 。 它 们 
以 不 同方 式 在 所 有 修改 融和 回收 器 之 间 分 配 任务 ， 对 于 修改 器 响应 时 间 、 回 收 吞 吐 量 和 堆 大 小 消 
耗 有 不 同 的 影响 。 

当 多 个 修改 顺和 回收 器 同时 访问 同一 个 对 象 时 , 它们 有 可 能 全 都 执行 读 屏 障 代码 , 但 是 每 个 
被 引用 对 象 只 能 被 一 个 线程 转发 一 次 。 这 是 由 obj_forward () 的 实现 保证 的 。 函 数 mark (src) 
可 能 被 不 同 的 线程 执行 多 次 。 它 必须 像 obj_forward () FEER SEE 
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17.1.5 ”基于 虚拟 内 存 的 “目标 空间 不 变 ” 算 法 


每 个 堆 模 位 访问 都 会 触发 基于 对 象 的 读 屏 障 ,但 只 有 当 被 访问 对 象 没有 被 扫描 过 时 才 有 实际 
效 来 。 和 以 前 一 样 ,很 自然 地 可 以 把 对 象 级 粒度 扩展 到 页 级 粒度 ,这 样 就 能 利用 操作 系统 的 虚拟 
内 存 支 持 来 实现 读 屏 障 。 在 灰 对 象 被 扫描 之 前 , 它 所 在 的 页 面 被 内 存 保护 为 不 可 访问 。 对 这 个 页 
面 的 任何 访问 都 会 触发 一 个 页 面 异常 ， 它 的 处 理 函 数 执行 读 屏 障 并 扫描 这 个 对 象 。 

因为 读 屏障 只 对 灰 对 象 有 效 , 所 以 应 该 对 只 持 有 灰 对 象 的 页 面 进 行内 存 保护 。 这 种 方式 不 需 
要 编译 天 搬 桩 读 屏 障 。 最 初 的 设计 由 Appel 等 人 提出 。 下 面 是 概念 代码 。 


// 加 载 对 象 src 的 slot 中 引用 的 读 屏 障 
Object* read barrier page (Object* src, Object** slot) 
{ 

Page* page = page of addr (srce); 

if( !is protected(page) ){ 

return *slot; 

} 

lock_page_scan (page) ; 

scan_page (page) ; 

unlock_page_scan (page) ; 

return *slot; 


} 


void scan_page(Page* page) 
{ 
if( !is_protected(page) ) return; 
// 把 页 面 从 灰色 变 为 黑色 
Object* obj = first_obj_in_page (page) ; 
while( obj ){ 
scan_obj (obj); 
obj = next_obj_in_page(page, obj); 
} 
unprotect (page) ; 
} 


void scan_obj (Object* obj) 
{ 
if( is_marked(obj) ) return; 
for(each reference field p_ref of obj) { 
Object* ref = *p_ref; 
*p_ref = obj_forward(ref); 
} 
mark (obj); 
} 


XADE BRP Te W AER ROA o DUT A Ae PERR LPT cae APF] GC PAXE scan_page () 。 
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一 个 页 面 在 被 扫描 之 前 就 被 锁定 了 , 这 样 其 他 线程 就 不 能 访问 它 。 代码 一 个 接 一 个 地 扫描 被 
保护 页 面 来 解除 保护 , 把 其 中 所 有 的 对 象 从 灰色 变 为 黑色 。 当 一 个 页 面 被 扫描 后 , 所 有 被 这 个 页 
引用 的 白 对 象 都 会 被 转发 。 必 须 修 改 函 数 obj_forwarg() 来 确保 它们 被 复制 到 内 存 保护 的 页 面 
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( 变 成 灰 对 象 )， 这 样 修改 器 对 它们 的 访问 会 触发 页 面 异 常 。 

这 段 代 码 没 有 展示 执行 页 面 保护 的 时 机 。 当 为 对 象 转发 分 配 一 个 新 页 面 的 时 候 , 在 任何 对 象 
被 复制 到 其 中 之 前 ， 这 个 页 面 就 立即 被 保护 并 锁定 。 当 ( 导致 新 页 面 分 配 的 ) 页 面 扫描 完成 后 ， 
或 者 当 新 页 面 被 写 满 的 时 候 , 不 管 哪 个 情况 更 早 发 生 ， 就 在 那 之 后 新 页 面 被 解锁 。 页 保护 仍然 开 
启 ， 直 到 这 页 本 身 被 扫描 。 

锁定 复制 页 面 是 因为 ， 当 一 个 白 对 象 被 转发 到 这 个 页 面 后 , 第 二 个 线程 可 能 完成 扫描 一 个 页 
面 ， 该 页 面 持 有 被 转发 对 象 的 引用 。 那 么 第 二 个 线程 可 能 访问 这 个 被 转发 对 象 , 这 应 该 触发 一 个 
页 面 异 常 ,并 且 页 面 异 常 处 理 师 数 在 这 个 锁 上 等 待 第 一 个 线程 完成 页 复制 。 总 结 一 下 就 是 ,页 面 
锁定 是 为 了 对 象 转发 ， 页 面 保护 是 为 了 对 象 转发 和 页 扫描 。 


在 “目标 空间 不 变 ” 回 收 中 ,新 对 象 分 配 为 黑色 的 ， 因 此 它们 不 需要 被 保护 。 任 何 安装 到 新 
对 象 的 引用 必须 指向 目标 空间 对 象 。 

基于 虚拟 内 存 的 解决 方案 有 一 个 好 处 : 它 可 以 提供 动态 回调 机 会 而 不 需要 编译 器 搬 桩 。 尽管 
如 此 , 以 上 设计 还 有 一 个 技术 挑战 需要 解决 。 当 修改 器 访问 一 个 内 存 保护 的 页 面 并 触发 页 面 异 常 
处 理 函数 的 时 候 , 异常 处 理 函 数 和 /或 回收 费 中 执行 的 GC 函数 应 该 能 够 访问 这 同一 个 页 面 , 以 进 
行 页 面 扫描 和 对 象 转发 。 这 可 以 通过 在 内 核 模式 下 运行 GC PRR, 或 者 把 同一 个 页 面 映射 到 有 具有 
不 同 保护 级 的 不 同 虚拟 地 址 上 来 实现 ,既然 对 一 个 页 面 的 内 存 保护 是 通过 处理 器 的 内 存 管理 单元 
在 虚拟 地 址 上 执行 的 , 那么 同一 个 物理 页 面 通过 不 同 的 虚拟 地 址 访问 , 或 者 被 不 同 的 处 理 器 访问 
的 时 候 ， 可 以 有 不 同 的 访问 权限 。 比 如 , 在 Linux 中 ， 可 以 使 用 shm_open () 来 创建 一 个 共享 内 
存 对 象 ， 然 后 用 不 同 的 保护 权限 映射 两 次 。 


17.2 并 发 复制 :“ 当 前 副本 不 变 ” 


在 “目标 空间 不 变 ” 算 法 中 , 读 屏障 要 求 ， 个 被 引用 对 象 在 源 空 间 时 ， 修 改 器 需要 在 继 
续 之 前 把 这 个 对 象 复制 到 目标 空间 中 ， 或 者 用 塞 等 待 其 他 线 各 完成 对 象 复制 。 这 有 有效 地 把 回收 和 
工作 转移 给 了 修改 器 * 这 个 设计 的 优点 是 整洁 性 , 可 达 性 分 析 和 对 象 图 修改 本 质 上 是 同一 个 过 程 。 
但 它 也 有 缺点 ， 那 就 是 把 回收 器 工作 放 到 了 修改 器 的 执行 中 。 


17.2.1 对象 移动 风暴 


“目标 空间 不 变 ”算法 的 读 屏障 有 一 个 后 果 ， 就 是 当 回收 的 翻转 阶段 结束 后 ， 修 改 器 恢复 运 
行 的 时 候 , 大 多 数 对 象 都 在 源 空间 中 , 需要 在 起 初 短暂 的 运行 期 间 被 转发 到 目标 空间 。 这 个 密集 
的 对 象 转发 过 程 被 称 为 “对 象 移动 风暴 ”"， 被 认为 是 回收 的 一 部 分 ,一 开始 可 能 会 严重 降低 修改 
需 的 运行 看 吐 量 。 然 后 ， 当 大 量 由 修改 顺 访 问 的 引用 被 转发 之 后 ， 这 个 情况 会 被 缓解 。 

可 以 通过 修改 器 的 分 配 率 , 或 者 其 他 可 以 指示 修改 器 平均 活跃 程度 的 指标 来 衡量 修改 器 的 运 
行 否 吐 量 。 如 果 使 用 分 配 率 来 指示 修改 器 的 运行 否 吐 量 , 那么 我 们 可 能 会 发 现 ,对 于 某 些 应 用 程 
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序 来 说 ,翻转 阶段 刚 结束 后 这 个 分 配 率 会 非常 低 。 对 象 移动 风暴 的 效果 也 可 能 非常 严重 ,以 至 于 
可 能 几乎 扼杀 了 修改 融 的 执行 ， 导 致 实质 上 类 似 于 STW 回收 的 方式 。 这 是 因为 每 个 修改 需 访 问 
都 附带 了 一 次 对 象 转发 ( 在 基于 覃 位 的 设计 中 标记 为 灰色 ), 或 者 一 次 对 象 扫描 ( 在 基于 对 象 的 
设计 中 标记 为 黑色 ), 或 者 一 次 页 扫描 (在 基于 页 的 设计 中 标记 为 黑色 ), 再 或 者 被 其 他 线程 的 这 
儿 个 动作 阻塞 。 

正如 我 们 已 经 提 到 过 的 , 可 以 把 读 屏障 和 写 屏障 看 作 回 收工 作 中 由 修改 器 执行 的 一 部 分 。 当 
这 个 工作 量 很 小 的 时 候 ， 就 像 在 分 代 式 GC 中 收集 记忆 和 集 那样 ， 可 以 把 它 看 作 修 改 噩 活动 的 一 部 
分 。 如 果 这 个 工作 量 并 非 微乎其微 ， 就 像 在 “目标 空间 不 变 ” 设 计 中 那样 ， 就 更 倾向 于 把 它 看 作 
“ 增 量 式 回 收 ” 的 一 部 分 ， 而 不 止 是 一 个 屏障 。 当 工作 量变 得 很 大 ， 并 且 在 一 段 时 间 里 几乎 饿 死 
修改 顺 的 时 候 ， 它 更 可 能 被 称 为 STW 阶段 。 

我 们 对 并 发 式 GC 设计 的 期 望 是 尽量 不 要 打扰 修改 融 的 执行 ,把 回收 工作 尽量 留 给 回收 器 
去 做 。 


17.2.2 “当前 副本 不 变 ” 设 计 


为 了 减轻 对 象 移动 风暴 , 一 个 解决 方案 是 允许 修改 器 访问 源 空间 中 还 没有 被 转发 的 对 象 ， 并 
让 回收 融 只 要 可 能 的 时 候 就 扫描 并 转发 对 象 。 这 种 方式 中 ,如 果 被 引用 的 对 象 未 被 转发 ， 则 读 屏 
障 并 不 转发 对 象 ， 而 是 直接 返回 当前 对 象 ; 如 果 已 经 被 转发 ， 则 返回 新 地 址 ， 如 以 下 代码 所 示 。 

Object* read_barrier_current (Object* obj) 

{ 


if( is_forwarded(obj) ) 
obj = forwarding_pointer (obj); 


return obj; 


) 

有 了 这 个 搬 桩 到 每 次 对 象 访问 中 的 读 屏障 , 修改 带 只 能 看 到 对 象 的 当前 副本 。 我们 把 这 个 算 
法 称 为 “当前 副本 不 变 ”。 

Brooks 提出 , 总 是 在 对 象 中 包含 一 个 转发 指针 。 如 果 这 个 对 象 已 被 转发 ， 它 的 转发 指针 指向 
新 副本 ; 否则 ， 就 指向 这 个 对 象 本 身 。 于 是 读 屏障 就 不 需要 检查 这 个 对 象 是 否 被 转发 ， 只 需要 解 
引用 这 个 引用 即 可 。 

对 于 “当前 副本 不 变 ” 算 法 ， 转 发 对 象 是 回收 器 的 责任 。 修 改 器 只 确保 访问 正确 的 副本 。 对 
象 转发 与 修改 器 执行 并 行 运行 。 系 统 中 同一 个 对 象 在 同一 时 间 可 能 有 两 个 副本 。 在 对 象 被 转发 之 
前 ， 源 空间 副本 是 当前 副本 。 在 它 被 转发 之 后 ， 目 标 空间 副本 是 当前 副本 。“ 当 前 副本 不 变 ” 算 
法 的 读 屏 障 确保 修改 融 只 访问 当前 副本 。 因 此 , 每 当 修改 融 访 问 一 个 对 象 的 数据 ,， 它 都 需要 在 访 
问 之 前 检查 这 个 对 象 是 否 已 被 转发 。 比 如 ， 当 一 个 修改 带 连 续 访 问 一 个 对 象 的 一 个 字段 两 次 时 ， 
这 两 次 访问 可 能 在 不 同 的 副本 上 执行 : 第 一 次 在 源 空 间 副 本 上 ， 第 二 次 在 目标 空间 副本 上 。 

这 意味 着 不 仅 是 从 对 象 中 加 载 一 个 引用 时 需要 读 屏 障 , 访问 对 象 的 任何 数据 都 需要 。 作 为 对 
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比 ,“ 目 标 空 间 不 变 ” 算 法 中 ,一 旦 一 个 引用 在 修改 器 的 执行 上 下 文中 ， 就 可 以 确定 这 个 引用 指 
向 目标 空间 。 当 修改 器 使 用 这 个 引用 访问 对 象 数据 的 时 候 ， 它 不 需要 再 次 检查 ， 因 为 可 以 确定 这 
个 引用 在 目标 空间 中 。 在 “当前 副本 不 变 ” 算 法 中 , 修改 器 执行 上 下 文中 的 引用 可 能 指向 源 空间 ， 
也 可 能 指向 目标 空间 。 


在 “目标 空间 不 变 ”算法 中 ， 当 修改 器 从 一 个 对 象 A 加 载 一 个 引用 R 的 时 候 执行 读 屏 障 。 
读 屏 障 并 不 检查 对 象 A 是 否 已 被 转发 ， 而 是 检查 被 引用 R 指向 的 对 象 。 与 之 相对 的 是 ,在 “当前 
副本 不 变 ” 算 法 中 ， 读 屏障 所 做 的 恰好 相反 。 它 检查 对 象 A 是 否 还 在 源 空间 中 ， 而 不 检查 加 载 
的 引用 Re。“ 当 前 副本 不 变 ” 算 法 只 确保 被 访问 的 对 象 是 当前 副本 ， 然 后 对 象 数据 〈 也 就 是 值 R ) 
一 定 是 当前 的 。 它 并 不 在 意 引 用 R 是 否 指向 源 空 间 ， 因 为 如 果 R 引用 的 对 象 已 被 复制 的 话 ， 读 
屏障 也 会 找到 正确 的 副本 。 


基于 上 述 讨论 ,“ 当 前 副本 不 变 ” 的 读 屏 障 实际 上 应 该 是 一 个 针对 对 象 读 和 写 的 “访问 屏障 ”。 
每 当 修改 器 需要 访问 一 个 对 象 ( 读 或 者 写 )， 它 们 应 该 只 访问 当前 副本 。 所 以 read_barrier_ 
current () 应 该 是 access_barrier_current (), 在 对 象 读 写 的 时 候 被 调用 。 下 面 给 出 使 用 的 
概念 代码 。 

Value object_read_current (Objectx obj, int field) 

i obj = access_barrier_current (obj) ; 


object_read(obj, field); 
} 


void object_write_current (Object* obj, int field, Value val) 
{ 

obj = access_barrier_current (obj); 

object_write(obj, field, val); 
} 


上 面 的 代码 很 直观 ， 但 在 多 线程 情况 下 它 是 有 问题 的 ， 因 为 在 调用 access_barrier_ 
current () 之 后 , 原来 在 源 空间 中 的 对 象 可 能 已 被 复制 , 那么 接 下 来 的 实际 访问 就 是 在 陈旧 副本 
上 了 。 只 有 在 转发 、 读 、 写 这 样 的 对 象 访问 彼此 为 原子 的 时 候 ， 这 段 代 码 才能 正常 工作 。 


下 面 的 代码 可 以 在 多 线程 环境 下 工作 。 


Value read_barrier_current (Object* obj, int field) 
{ 
Value val = object_read(obj, field); 
if( in_from_space(obj) && is_forwarded(obj) ){ 
obj = forwarding_pointer (obj); 
val = object_read(obj, field); 
} 
return val; 


} 


void write_barrier_current (Object* obj, int field, Value val) 
{ 

bool fld_is_ref = field is ref (field); 

// 把 当前 副本 的 地 址 写 入 字段 。 这 不 是 可 选 的 
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if(fld_is_ref && in_from_space(val) && is_forwarded(val) ) 
val = forwarding_pointer (val); 


if( !in_from_space(obj) ) { 
object_write(obj, field, val); 
}else{ // 对 象 在 源 空 间 
if( !is_forwarded(obj) ){ 
bool success = lock_forwarding (obj); 
if( success ) { 
object_write(obj, field, val); 
unlock_forwarding (obj); 
return; 
jelse{ 
while( !is_forwarded(obj) ); 
} 
} 
// 对 象 已 被 转发 
obj = forwarding_pointer (obj); 
object_write(obj, field, val); 
} 

} 

这 个 读 屏 障 首先 读 取 这 个 字段 ， 然 后 检查 这 个 对 象 是 否 被 转发 。 如 果 它 已 被 转发 ,修改 器 再 
次 从 转发 的 副本 读 取 这 个 字段 。 如 果 当 前 副本 在 源 空间 中 , 这 个 写 屏障 是 昂贵 的 ， 因 为 它 需要 锁 
定 这 个 对 象 ， 防止 回收 器 复制 它 。 除 此 之 外 ,， 写 屏障 和 读 屏 障 的 所 有 其 他 情况 下 开销 都 很 小 。 根 
据 应 用 程序 的 特性 ， 与 对 象 移动 风暴 相 比 ， 这 个 权衡 可 能 是 值得 的 。 

也 可 以 使 用 类 似 于 读 屏障 的 技术 ,避免 写 屏障 中 的 锁定 操作 。 也 就 是 说 ,如 果 这 个 对 象 不 在 
转发 中 或 还 没 被 转发 ( 即 在 它 被 回收 器 接触 之 前 )， 修 改 器 就 写 人 这 个 字段 。 然 后 它 再 次 检查 这 
个 对 象 是 否 在 转发 中 或 者 已 被 转发 。 如 果 是 的 话 , 复制 可 能 发 生 在 写 和 之前。 修改 器 会 等 待 这 个 
对 象 被 转发 ， 然 后 再 次 写 人 到 转发 的 副本 。 不 使 用 锁定 ， 这 个 操作 的 正确 性 依赖 于 内 存 一 致 性 模 
型 。 上 面 描述 的 序列 在 处 理 器 一 致 性 或 者 更 强 的 一 致 性 〈( 比如 完全 存储 排序 ，total store order ) 
之 下 是 正确 的 。Huelsbergen 和 Larus 使 用 了 这 项 技术 。 我 们 把 这 个 解决 方案 称 为 “无 锁 ” 的 复制 
写 屏 障 ， 把 在 此 之 前 的 解决 方案 称 为 “基于 锁 ” 的 复制 写 屏 障 。 


17.23 并 发 复制 与 并 发 堆 追 踪 的 关系 

假定 对 象 转发 工作 对 修改 器 而 言 是 完全 不 可 见 的 , 那么 并 发 复制 算法 可 以 类 似 于 并 发 非 移动 
式 设 计 。 如 果 用 三 色 术 语 表 述 ， 我 们 只 需要 重新 定义 白色 、 灰 色 和 黑色 的 含义 ， 举 例如 下 。 

(1) 源 空间 中 的 活跃 对 象 为 白色 。 

(2) 把 一 个 对 象 标记 为 灰色 ， 意 思 是 转发 这 个 对 象 。 

G) 把 一 个 新 对 象 标记 为 黑色 ， 意 思 是 这 个 新 对 象 中 所 有 的 引用 字段 都 已 被 转发 。 

图 17-3 是 以 上 思路 的 一 个 展示 。 图 中 , 被 转发 对 象 的 两 个 副本 都 展示 了 出 来 ， 原 来 的 副本 在 
源 空 间 相 应 位 置 上 用 半 透 明 颜色 表示 。 
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图 17-3 并 发 移动 式 与 非 移动 式 垃圾 回收 (GC ) 的 相似 性 

1. 基于 并 发 追踪 算法 的 并 发 复制 

根据 前 面 的 观察 , 可 以 通过 应 用 并 发 追踪 算法 来 设计 并 发 复制 算法 , 比如 SATB 或 INC 的 思 
路 。 这 对 “当前 副本 不 变 ” 并 发 复制 而 言 是 合理 的 。 原 因 是 ,“ 当 前 副本 不 变 ” 算 法 不 像 “ 目 标 
空间 不 变 ” 算 法 那样 要 求 修改 器 执行 回收 工作 。 换 名 话说 ,“ 当 前 副本 不 变 ”算法 中 的 修改 器 不 
参与 可 达 性 分 析 ( 寻找 活跃 对 象 )， 而 只 是 修改 对 象 邻 接 图 。 回 收 器 通过 在 后 台 复 制 活 跃 对 象 来 
执行 可 达 性 分 析 ， 而 并 发 追踪 算法 以 同样 的 设置 运行 ， 因 此 是 合适 的 。 

INC 并 发 复制 : 使 用 INC 算法 的 思路 , 需要 一 个 写 屏 障 来 捕获 黑 对 象 中 指向 白 对 和 象 的 引 

用 写 。 它 可 以 是 记忆 引用 变 体 或 记忆 根 变 体 。 

如 果 是 记忆 引用 变 体 的 话 ， 写 屏障 可 以 直接 转发 被 引用 对 象 ， 把 对 象 变 为 灰色 。 如 果 是 

记忆 根 变 体 的 话 ， 应 该 记忆 引用 被 写 入 的 黑 对 象 ， 用 于 重新 扫描 。 

与 在 INC 并 发 追踪 中 一 样 , “INC 并 发 复制 ”需要 执行 第 二 轮 正确 复制 ， 重 新 扫描 根 集 

和 记忆 集 。 如 果 在 第 二 轮 中 ,一 个 对 象 在 源 空间 被 发 现 ， 它 将 被 转发 和 扫描 。 可 以 有 多 

个 中 间 轮 的 重新 扫描 ， 以 减少 最 后 一 轮 正 确 复制 的 回收 时 间 ， 如 果 正 确 复制 轮 是 STW 

的 话 ， 这 可 能 会 有 很 大 用 处 。 

在 这 个 设计 中 ， 新 对 象 可 以 在 源 空间 中 作为 白 对 象 被 分 配 。 


SATB 并 发 复制 : 使 用 SATB 的 思路 ， 需 要 一 个 写 屏 障 来 捕获 非 黑 对 象 中 指向 白 对 象 的 
被 覆盖 引用 。 它 可 以 是 基于 模 位 的 变 体 或 基于 对 象 的 变 体 

如 果 是 基于 槽 位 的 ， 写 屏障 可 以 直接 转发 被 履 盖 引用 指向 的 对 象 ， 把 它 变 为 灰色 。 如 果 
是 基于 对 象 的 ， 可 以 扫描 这 个 非 黑 对 象 ， 使 得 它 的 所 有 引用 对 象 都 变 为 灰色 。 如 果 这 个 
非 黑 对 象 本 身 还 未 被 转发 ， 就 转发 它 ， 使 它 变 为 黑色 。 

既然 源 空间 中 白 对 象 ( 或 快照 ) 的 总 量 是 固定 的 ,与 回收 器 一 起 ,“SATB 并 发 复制 ” 算 
法 可 以 在 一 轮 收敛 


在 这 个 设计 中 ， 新 对 象 在 目标 空间 中 作为 已 扫描 对 象 分 配 。 
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2. “当前 副本 不 变 ” 的 正确 设计 

从 上 面 的 讨论 中 ， 我们 知道 ， 要 完成 “当前 副本 不 变 ”GC 的 设计 ， 还 需要 几 处 修改 。 

首先 ， 上 面 的 写 屏 障 write_barrier_current () 没 有 包含 用 于 SATB 或 INC 写 屏 障 的 代 
码 。 它 们 可 以 独立 实现 ， 也 可 以 合并 到 一 个 写 屏障 中 。 

其 次 ,既然 修改 絮 可 以 看 到 两 个 空间 的 对 象 ， 那么 这 个 设计 应 该 确保 在 回收 结束 时 ,目标 空 
间 中 的 所 有 引用 值 都 已 被 更 新 ( 为 指向 目标 空间 )。 

“当前 副本 不 变 ” 算 法 只 保证 修改 器 读 写 当前 副本 的 数据 ， 并 不 要 求 每 个 引用 都 指向 当前 副 
本 。 比 如 ， 一 个 指向 白 对 象 的 引用 R 可 以 被 写 人 黑 对 象 A 中 。 当 这 个 白 对 象 被 转发 后 ， 指 向 新 
副本 ( 现在 是 当前 副本 ) 的 男 一 个 引用 R' 可 能 被 写 入 男 一 个 黑 对 象 B P. MAENZ (AMB) 
就 持 有 指向 同一 对 象 的 不 同 副 本 的 引用 CR AR’), HH A 中 的 引用 RR 是 过 时 的 ， 应 该 被 修正 。 

在 INC 设计 中 ， 既 然 写 屏 障 确 保 了 所 有 写 入 黑 对 象 的 白 引 用 ( 即 指向 源 空间 的 引用 ) 会 被 
捕获 ,并 且 被 引用 的 对 象 会 被 转发 , 剩 下 的 唯一 可 能 持 有 白 引 用 的 位 置 就 是 修改 器 的 执行 上 下 文 。 
第 二 轮 正确 追踪 将 重新 扫描 根 集 和 记忆 集 ， 转 发 并 修正 所 有 剩 下 的 白 引 用 。 这 不 是 一 个 问题 。 

在 SATB 设 计 中 ， 它 的 写 屏 障 并 不 像 INC 设计 的 写 屏障 那样 ， 会 捕获 写 人 黑 对 象 的 白 引 用 。 
当 我 们 说 它 在 一 轮 中 收敛 时 , 我 们 的 意思 是 所 有 源 空 间 中 的 白 对 象 已 经 在 一 轮 中 被 转发 到 了 目标 
空间 。 它 并 不 保证 修改 费 的 执行 上 下 文 和 堆 中 的 所 有 引用 都 被 修正 。 它们 中 的 一 些 可 能 还 指向 源 
空间 。 

既然 “当前 副本 不 变 ” 写 屏障 保证 只 写 入 当前 副本 的 引用 ， 当 所 有 对 象 的 当前 副本 都 在 目标 
空间 中 时 ， 就 不 会 再 发 生 向 黑 对 象 安装 白 引 用 的 情况 , 这 是 因为 这 样 的 安装 只 能 发 生 在 所 有 白 对 
象 被 复制 完成 之 前 。 因 为 SATB 在 有 限时 间 内 转发 所 有 白 对 象 ， 所 以 在 这 个 过 程 中 ， 向 黑 对 象 安 
装 白 引用 的 数量 也 是 有 限 的 ， 因 此 可 以 用 一 个 修改 过 的 写 屏障 记录 下 来 。 在 SATB 收敛 之 后 ， 回 
收 需 可 以 修正 这 些 被 记忆 的 白 引 用 。 

但 是 和 NC 设计 一 样 ， 修 改 器 执行 上 下 文中 仍然 可 能 有 白 引用 。 为 了 完成 这 个 设计 ， 需 要 
一 轮 根 集 枚 举 来 修正 这 些 引 用 。 这 不 需要 STW， 因 为 写 屏 障 确保 了 修改 器 上 下 文中 的 白 引用 不 
能 逃逸 到 别 的 修改 需 或 推 中 。 

上 述 讨论 揭示 了 “当前 副本 不 变 ”SATB 设计 需要 记忆 安装 在 黑 对 象 中 的 白 引 用 ， 并 需要 重 
新 扫描 根 集 ， 这 使 得 它 与 INC 设计 类 似 。 换 句 话 说， 对 于 “当前 副本 不 变 ” 来 说 ，SATB 设计 可 
能 不 是 一 个 好 的 选择 。 

为 了 实现 正确 设计 , 最 后 需要 修改 的 是 引用 等 价 性 检查 。 为 了 比较 两 个 引用 的 等 价 性 ,修改 
融和 需要 检查 被 引用 对 象 是 否 已 被 转发 ,有 可 能 这 两 个 引用 指向 同一 对 象 的 不 同 副 本 。 这 种 情况 下 ， 
Brooks 的 提议 是 有 用 的 : 总 在 对 象 中 包含 一 个 转发 指针 。 


292 PATE 并 发 移动 式 回 收 


17.3 并 发 复制 :“ 源 空间 不 变 ” 


现在 我 们 已 乡 pe 了 “目标 空间 不 变 ” 和 “当前 副本 不 变 ” 并 发 复制 算法 。 我们 很 自然 会 考 
虑 能 否 设 计 一 种 “ 源 空间 不 变 ” 并 发 复制 式 GC。 当 回收 器 转发 活跃 对 象 的 时 候 ， 修 改 融 只 操作 
源 空间 对 象 ee tenn 源 空间 和 目标 空间 的 角色 可 以 互 换 


这 个 设计 需要 把 两 个 空间 都 保持 最 新 : 一 个 用 于 修改 器 的 当前 操作 , 另 一 个 用 于 它们 在 空间 
翻转 之 后 的 操作 。 aii de 与 另外 两 种 只 “更 新 当前 
副本 的 复制 思路 相 比 ， 思路 有 一 个 明显 的 缺点 。“ 目 标 空间 不 变 ” 和 “当前 副本 不 变 ” 这 两 
ee 对 于 它们 来 说 ， 只 有 在 对 象 没 有 被 转发 的 时 候 ， 源 空间 
副本 才 被 认为 是 当前 副本 。 





17.31 “ 源 空间 不 变 ” 设 计 


在 “目标 空间 不 变 ” 设 计 中 ,修改 器 不 得 不 与 回收 深度 耦合 。 在 变 为 修改 器 可 见 之 前 ， 每 个 
加 载 到 执行 上 下 文中 的 引用 都 要 被 转发 。 

在 “当前 副本 不 变 ” 设 计 中 ,修改 器 与 回收 的 看 合 没 那么 深 。 对象 转发 工作 可 以 与 修改 器 的 
执行 路 径 相 分 离 。 修 改 器 只 是 跟着 转发 指针 来 访问 当前 副本 , 但 需要 使 用 同步 来 避免 修改 写 与 回 
收 器 复制 之 间 的 竞 态 条 件 。 

* 源 空间 不 变 ”设计 可 以 进一步 解 看 修改 器 与 回收 器 之 间 的 交互 ， 其 中 修改 器 永远 不 会 操作 
目标 空间 。 从 根 集 开始 ， 回 收 器 并 发 追踪 堆 以 获得 活跃 对 象 ， 并 把 它们 复制 到 目标 空间 。 建 立 一 
个 映射 表 , 把 对 象 地 址 从 源 空间 映射 到 目标 空间 ,这 可 以 是 一 个 目标 映射 表 , 也 可 以 通过 转发 指 
针 来 完成 。 并 发 复制 完成 之 后 ， 修 改 器 被 再 次 暂停 ， 以 通过 映射 表 更 新 根 集 引用 指向 目标 空间 
此 时 ， 这 两 个 空间 翻转 ， 修 改 器 可 以 恢复 运行 。 

1. “ 源 空间 不 变 ”设计 的 写 屏 障 

当 修改 器 操作 任何 一 个 已 被 转发 的 对 象 时 ( 即 进行 修改 )， 写 屏障 会 更 新 两 个 副本 ， 或 者 只 
更 新 原始 副本 ， 并 在 修改 日 志 中 记录 修改 ， 这 样 回收 器 可 以 对 新 副本 应 用 这 些 修改 . 

这 个 设计 中 存在 潜在 的 竞 态 条 件 。 一 个 潜在 的 竞 态 条 件 是 , 某 个 对 象 被 修改 器 写 信 的 同时 又 
被 回收 器 复制 。 写 屏障 应 该 确保 回收 器 不 会 丢失 任何 修改 。 一 个 简单 的 解决 方案 是 总 是 在 复制 开 
始 之 前 记忆 所 有 的 修改 

另 一 个 潜在 的 竞 态 条 件 是 ， 当 多 个 修改 器 写 入 同一 个 数据 字段 的 时 候 , 原始 副本 中 呈现 的 写 
入 顺序 可 能 与 新 副本 中 维护 的 不 一 致 ， 因 为 一 个 修改 器 对 原始 副本 和 新 副本 ( 或 修改 日 志 ) 的 两 
次 写 入 对 其 他 修改 器 的 两 次 写 入 来 说 并 不 是 单个 原子 操作 。 可 能 的 结果 是 ,一 个 修改 器 在 原始 副 
本 中 胜出 ， 而 另 一 个 修改 器 在 新 副本 中 胜出 。 这 个 问题 可 以 通过 只 记忆 写 发 生 时 的 原始 字段 地 址 
来 避免 。 回 收 器 在 应 用 日 志 的 时 候 会 解 引用 这 个 地 址 来 获得 原始 副本 中 的 当前 值 。 其 无 锁 版 本 的 
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伪 代 码 如 下 所 示 。 
Value write_barrier_from(Object* obj, int field, Value val) 
{ 
object_write(obj, field, val) 
// FORWARDING_ = 在 回收 器 开始 复制 之 前 被 置 起 ， 
// 这 一 位 不 会 被 清 
J Bg A E ){ 
remember (obj, field); 
} 
} 


也 可 以 通过 男 一 种 方式 设计 写 屏 障 , 就 是 让 它 把 被 写 对 象 标 记 为 脏 对 象 , 然后 回收 需 重 新 复 
制 这 个 脏 对 象 , 在 极端 的 情况 下 , 所 有 的 对 象 都 被 标记 为 脏 对 象 , 这 意味 着 它们 都 要 被 重新 复制 。 
脏 对 象 一 旦 被 复制 就 会 变 干净 ， 之 后 任何 在 其 上 的 写 和 人 又 会 把 它 再 次 变 脏 。 就 像 INC 堆 追 踪 过 
程 中 的 再 扫描 一 样 ,， 再 复制 也 可 以 执行 多 轮 。 在 最 后 的 翻转 阶段 ( 这 通常 是 一 个 STW 阶段 ) 中 ， 
会 处 理 剩 余 的 日 志和 变 脏 的 对 象 ， 以 保持 两 个 空间 一 致 。 

为 了 避 兔 太 多 宛 余 的 数据 复制 , 并 发 复制 可 以 把 堆 追 踪 和 对 象 复 制 解 耘 。 方 法 是 让 回收 器 首 
先 只 追踪 堆 ， 找 到 活跃 对 象 并 计算 它们 在 目标 空间 的 新 地 址 ， 并 不 实际 复制 活跃 对 象 。 然 后 回收 
需 把 活跃 对 象 复制 到 它们 预先 计算 好 的 地 址 上 , 并 更 新 目标 空 oa 
式 回 收 转 换 为 并 发 压缩 ， 稍 后 会 详细 讨论 。 不 管 是 哪 种 情况 ， 当 回收 器 开始 复制 对 象 的 时 候 ， 
屏障 和 最 终 的 翻转 阶段 可 以 确保 数据 一 致 性 。 

注意 ,“ 源 空间 不 变 ” 设 计 不 需要 读 屏 障 ， 这 是 一 个 优势 。 

2. “ 源 空间 不 变 ” 算 法 的 堆 追 踪 

这 里 的 追踪 算法 可 以 类 似 于 SATB 或 者 INC 并 发 追踪 。 写 屏障 可 以 合并 用 于 堆 追 踪 和 写 日 志 
的 代码 。INC 算法 与 “ 源 空间 不 变 ” 写 屏障 合作 更 容易 一 些 ， 因 为 二 者 都 需要 记忆 写 : INC 算法 
只 记忆 引用 写 ， 而 “ 源 空间 不 变 ” 算 法 记忆 所 有 的 写 。 不 过 使 用 SATB 追踪 算法 也 没什么 问题 

需要 选择 让 回收 需 追 踪 哪 个 空间 ， 是 源 空间 还 是 目标 空 

源 空间 追踪 : 如 果 要 追踪 源 空间 ， 当 一 个 对 象 被 复制 后 ， 这 个 对 象 包含 的 引用 都 指向 源 

空间 。 

我 们 想 要 目标 空间 维护 这 样 一 个 特性 ,就 是 其 中 的 所 有 引用 都 指向 目标 空间 。 换 句 话 说， 

没有 跨 空 间 引 用 。 这 与 另外 两 种 并 发 复制 算法 是 不 同 的 。 

三 色 术 语 定义 如 下 。 

(1) 默认 情况 下 ， 源 空间 内 的 所 有 对 象 都 为 白色 。 

(2) 当 一 个 对 象 的 新 地 址 被 计算 出 后 ( 即 重 定位 )， 就 被 标记 为 灰色 。 

(3) 一 个 对 象 被 复制 后 ， 就 被 标记 为 黑色 。 

ea 色 ， 也 就 是 说 ， 被 重 定 向 了 
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当 一 个 对 象 引 用 被 压 入 标记 栈 时 ， 它 就 变 为 灰色 ， 回 收 器 计算 它 的 新 地 址 。 在 被 引用 对 

象 被 扫描 后 ， 其 引用 从 标记 栈 弹 出 时 ， 这 个 对 象 就 变 为 黑色 ， 并 被 复制 。 当 这 个 对 象 被 

复制 后 ， 新 副本 应 该 通过 使 用 映射 表 ， 把 它 包 含 的 所 有 引用 更 新 为 指向 各 自 的 新 值 。 

当 回 收 器 对 复制 的 对 象 应 用 修改 日 志 的 时 候 ， 如果 修 改 是 一 个 引用 写 , 回收 器 应 该 在 应 

用 修改 之 前 计算 它 的 新 地 址 ( 即 把 它 标记 为 灰色 )， 以 确保 没有 白 引 用 被 写 入 黑 对 象 

目标 空间 追踪 : 如 果 要 追踪 目标 空间 , 第 一 步 是 把 所 有 根 集 引 用 的 对 象 复制 到 目标 空间 ， 

然后 从 扫描 这 些 新 副本 开始 追踪 。 

当 遇 到 一 个 指向 源 空间 的 引用 的 时 候 , 回收 器 把 被 引用 对 象 复 制 到 目标 空间 ， 然 后 把 引 

用 更 新 为 指向 新 副本 。 在 这 个 设计 中 ， 三 色 术 语 定义 如 下 。 

(1) 源 空间 的 所 有 活跃 对 象 都 为 白色 。 目 标 空间 中 没有 白 对 象 。 

(2) 复制 一 个 对 象 就 是 把 新 副本 标记 为 灰色 。 

(3) 扫描 一 个 新 副本 就 是 把 它 标 记 为 黑色 。 

这 与 “目标 空间 不 变 ” 设 计 类 似 ， 除 了 一 点 ， 那 就 是 现在 的 复制 和 扫描 由 回收 器 完成 ， 

而 不 是 由 修改 器 在 读 屏 障 中 完成 。 最 基本 的 区 别 在 于 ， 一 个 对 象 的 活性 现在 由 INC 或 

SATB 堆 追 踪 可 达 性 决定 ， 而 不 是 “目标 空间 不 变 ” 的 活性 规则 : 被 访问 的 对 象 是 活跃 

对 象 

目标 空间 维护 了 一 个 特性 ,， 那 就 是 所 有 黑 对 象 只 有 指向 目标 空间 的 引用 。 对 目标 空间 应 

用 修改 日 志 的 时 候 ， 如果 是 一 个 对 扫描 过 的 对 象 的 引用 写 ， 那 么 被 引用 的 对 象 应 该 被 复 

制 ， 以 保持 这 个 目标 空间 特性 。 首 个 “ 源 空间 不 变 ” 并 发 复制 设计 由 Nettles 和 O’ Toole 

提出 ， 其 中 使 用 目标 空间 的 INC 追踪， 他 们 称 其 为 “基于 复制 ”的 回收 。 

上 面 的 源 空间 追踪 过 程 有 单独 一 赵 ， 其 中 包含 标记 、 新 地 址 计算 、 对 象 复制 和 引用 更 新 等 所 
有 操作 。 ee eet oe ee ede Ld 
性 。 目 标 空间 追踪 不 具有 这 个 性 质 ， 因 为 它 需 要 把 被 引用 对 象 复制 到 目标 空间 才能 继续 追 


关于 “ 源 空间 不 变 ” 算 法 的 一 点 提醒 是 ， 如 果 转 发 指针 安装 在 源 空间 对 象 头 中 ， 它 可 能 会 影 
响 需 要 访问 对 象 头 信息 的 修改 器 执行 。 这 种 情况 下 , 应 该 插 桩 修改 器 所 有 在 对 象 共 上 的 操作 以 遵 
循 转发 指针 ,并 从 目标 空间 的 副本 提取 原来 的 对 象 头 信息 。 为 了 避免 这 个 问题 ， 可 以 使 用 一 个 目 
标 映射 表 。 


17.3.2 部 分 转发 “ 源 空间 不 变 ” 设 计 


根据 “ 源 空间 不 变 ” 的 原则 ， 新 对 象 应 该 被 分 配 在 源 空间 中 。 如 果 使 用 SATB 追踪 算法 ， 
Bia aA ALTERED 那么 它们 应 该 被 复制 到 目标 空间 ， 并 记忆 所 有 在 其 上 的 修改 。 

这 可 能 很 昂贵 ， 如 果 不 说 是 元 余 的 话 。 最 好 是 让 它们 就 竺 在 目标 空间 ， 以 避免 复制 和 修改 日 志 
应 用 。 
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一 个 解决 方案 是 在 一 个 专用 空间 中 分 配 新 对 象 ,其 中 的 对 象 不 被 复制 ,这 与 之 前 讨论 过 的 “部 
分 转发 ”回收 类 似 , 其 中 上 一 次 回收 之 后 最 新 分 配 的 对 象 在 这 一 次 回收 中 不 被 转发 ， 而 是 在 下 一 
次 回收 时 ， 也 就 是 它们 1 岁 的 时 候 才 被 转发 。 
图 17-4 展示 了 这 个 单独 新 空间 的 思路 。 
回收 前 : -==> MKE: 
源 空间 ”新 空间 目标 空间 目标 空间 ” 新 空间 











ON emcee i (Fea eA 至 间 ”目标 空间 
GZ z 
保留 用 A 
mY Ze 
GF 如 收 之 前 的 对 象 回收 之 后 的 对 象 【| 空闲 空间 





图 17-4 ”部 分 转发 源 空间 回收 
一 次 回收 之 后 , 用 于 分 配 的 保留 空闲 空间 持 有 在 这 次 并 发 回收 过 程 中 分 配 的 新 对 象 。 它们 会 
在 下 一 次 回收 中 与 源 空间 一 起 被 回收 。 
一 个 解决 方案 是 分 代 设 计 ， 其 中 第 一 代 是 新 空间 ， 第 二 代 包 含 源 空间 和 目标 空间 。 


17.4 无 STW 的 完整 并 发 移动 


并 发 复制 算法 通常 采用 一 个 STW 阶段 用 于 根 集 枚 举 或 空间 翻转 。 这 并 不 总 是 必需 的 。 根 集 
枚 举 的 初始 阶段 可 以 被 替换 为 并 发 根 集 枚 举 。 如 果 满 足以 下 条 件 ， 空 间 翻转 的 最 后 阶段 也 不 需 
要 STW。 

(1) 所 有 活跃 对 象 都 已 经 被 扫描 。 

(2) 新 对 象 分 配 在 目标 空间 中 。 

(3) 向 已 扫描 对 象 安 装 的 指向 白 对 象 的 引用 可 以 被 捕获 。 

堆 中 完全 没有 白 对 象 。 修 改 融 上 下 文中 剩余 的 白 引 用 不 需要 STW 就 可 以 被 修正 。 


这 意味 着 把 它们 放 在 一 起 就 可 以 实现 无 STW 的 并 发 移动 式 回收 。 
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17.5 ”并 发 压缩 回收 


这 里 的 压缩 是 指 就 地 回收 。 复制 式 回 收 是 压缩 回收 的 一 个 特殊 形式 , 但 是 保留 了 半 个 堆 ， 因 
此 不 是 就 地 回收 。 可 以 设计 并 发 就 地 压缩 GC， 但 是 我 们 先 从 部 分 复制 式 回收 开始 。 





17.5.1 并 发 区 域 复制 式 回收 


当 通 过 复制 回收 垃圾 的 时 候 ， 回 收 器 可 以 选择 复制 堆 的 一 部 分 ， 就 像 在 部 分 转发 或 区 域 式 
GC 中 一 样 。 如 果 堆 中 的 一 些 区 域 生 存 率 较 低 ， 这 很 有 用 ， 因 为 可 以 获得 较 高 的 回收 吞吐 量 。 当 
堆 中 没有 保留 足够 大 的 空闲 空间 以 供 复制 回收 所 有 对 象 的 时 候 ， 这 也 很 有 用 。 

1. 单 趟 区 域 复制 

回收 器 可 以 从 第 一 个 清空 区 域 复制 幸存 者 到 空闲 保留 区 域 , 然后 把 第 一 个 清空 区 域 清空 。 然 
后 回收 器 可 以 继续 从 第 二 个 清空 区 域 复制 幸存 者 到 空闲 保留 区 域 的 剩余 空闲 空间 中 。 当 这 个 空闲 
区 域 满 了 之 后 ,可 以 利用 第 一 个 清空 区 域 来 复制 对 象 , 现在 它 已 经 是 空 的 。 回 收 器 可 以 一 个 区 域 
接 一 个 区 域 地 有 效 回收 整个 堆 , 我 们 称 为 一 轮 完整 回收 。 当 空闲 保留 区 域 大 小 与 堆 相 比 很 小 的 时 
候 ， 一 轮 完 整 回收 的 效果 类 似 于 一 次 就 地 压缩 。 在 回收 期 间 ， 空 闲 保留 区 域 也 用 于 新 对 象 分 配 。 

要 使 区 域 复制 成 为 可 能 ,第 一 个 任务 是 找到 目标 清空 区 域 中 的 所 有 活路 对象。 如 果 目 标清 空 
区 域 ( 源 区 域 ) 和 空闲 保留 区 域 ( 目标 区 域 ) 在 回收 开始 之 前 是 已 知 的 ,那么 堆 追 踪 趟 可 以 与 对 
象 复 制 趟 合并 , 就 像 在 普通 并 发 复制 式 回收 中 一 样 。 我们 可 以 应 用 前 面 介绍 过 的 任何 一 种 并 发 复 
制 算 法 ， 只 需要 一 点 修改 ， 就 是 不 转发 非 清 空 区 域 的 对 象 。 

例如 ， 并 发 区 域 复制 的 “目标 空间 不 变 ” 读 屏障 代码 如 下 所 示 。 同 时 ， 回 收 需 从 根 集 开始 扫 
描 整 个 堆 来 转发 和 更 新 所 有 指向 源 区 域 的 引用 。 

Object* read_barrier_slot (Object* src, Object** slot) 

Object? obj = *slot; 

if( in_from_region(obj) ){ 
if( !is_forwarded(obj) ){ 
obj_forward (obj); 
} 
obj = forwarding_pointer (obj); 
zalot = 6b]; 
} 


return obj; 


} 


单 趟 区 域 复 制 有 一 个 问题 。 对 于 每 个 区 域 上 的 回收 ， 都 需要 一 遍 完整 的 堆 追 踪 , 在 追踪 时 复 
制 对 象 。 这 是 巨大 的 开销 。 


2. 独立 一 趟 的 堆 追 踪 
一 个 解决 方案 是 采用 独立 的 一 趟 进行 专门 的 堆 追 踪 , 然后 每 个 区 域 的 回收 只 复制 这 个 区 域 的 
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活跃 对 象 , 不 再 追踪 堆 。 这 节省 了 大 量 追 踪 时 间 。 使 用 独立 一 趟 追踪 的 另 一 个 好 处 是 ,追踪 之 后 
每 个 区 域 的 生存 率 是 已 知 的 。 那 么 回收 器 就 可 以 优先 选择 回收 能 够 带 来 最 高 回收 否 吐 量 的 区 域 。 
这 个 设计 并 没有 保留 压缩 的 滑动 属性 。 

既然 已 经 知道 一 个 区 域内 的 所 有 活跃 对 象 , 就 可 以 在 复制 之 前 计算 它们 在 目标 区 域 的 新 位 置 
( 即 重 定位 这 些 对 象 )。 然 后 就 可 以 并 行 执行 源 区 域 活跃 对 象 移动 和 整个 堆 中 对 象 的 引用 修正 了 ， 
因为 引用 修正 不 需要 等 待 对 象 复制 完成 。 

我 们 使 用 “目标 空间 不 变 ” 来 讨论 复制 阶段 。 它 在 堆 追 踪 趟 和 源 区 域 所 有 活跃 对 象 都 被 重 定 
位 之 后 开始 。 这 里 三 色 术 语 定义 如 下 。 

(1) 源 区 域 所 有 活跃 对 象 默认 为 白色 。 

(2) 如 果 一 个 对 象 被 复制 到 目标 区 域 , 或 者 如 果 它 包含 指向 源 区 域 的 引用 , 这 个 对 象 为 灰色 。 

(3) 如 果 一 个 对 象 被 扫描 过 ， 因 此 它 包 含 的 所 有 引用 都 已 被 修正 ， 这 个 对 象 为 黑色 。 


和 第 一 步 一 样 , 需要 一 个 翻转 阶段 把 根 集 引 用 从 源 区 域 重 定位 到 目标 区 域 , 并 且 需 要 打开 一 
个 读 屏障 ， 在 加 载 的 引用 对 修改 器 可 见 之 前 转发 它们 。 然 后 所 有 的 修改 需 被 恢复 继续 执行 。 
同时 ， 回 收 器 并 行 执行 以 下 两 个 任务 。 
对 象 复制 : 把 源 区 域 对 象 复制 到 目标 区 域 。 因 为 所 有 的 新 地 址 已 经 被 计算 出 来 了 ， 所 以 
复制 就 只 是 一 个 接 一 个 地 和 迭代 转发 区 域内 的 活跃 对 象 
复制 可 以 在 源 区 域 开 始 , 也 可 以 在 目标 区 域 开 始 。 如 果 它 在 源 区 域 开 始 ， 回 收 器 可 以 把 
这 个 区 域 分 成 块 。 每 个 回收 器 从 源 区 域 动态 抓 取 并 处 理 一 个 块 。 
如 果 复 制 从 目标 区 域 开 始 ， 那 么 会 更 平衡 回收 器 把 目标 区 域 分 成 块 ， 即 目标 块 。 这 类 
似 于 我 们 讨论 过 的 并 行 压缩 中 的 处 理 .每 个 回收 器 从 目标 区 域 动 态 抓 取 并 处 理 一 个 目标 
块 。 对 于 每 个 目标 块 ， 回 收 器 找到 源 区 域内 映射 到 它 的 第 一 个 源 对 象 ， 然 后 继续 线性 复 
制 源 区 域 的 对 象 , 这 要 求 每 个 目标 块 记忆 在 哪里 可 以 找到 第 一 个 源 对 象 。 可 以 在 回收 器 
计算 活跃 对 象 新 地 址 的 时 候 执行 这 项 工作 。 这 类 似 于 在 并 行 压缩 算法 中 建立 的 依赖 树 。 
正如 前 文 已 经 讨论 过 的 ,“ 目 标 空间 不 变 ” 算 法 可 以 是 基于 槽 位 的 ， 也 可 以 是 基于 对 象 
的 .基于 覃 位 的 设计 在 修改 器 访问 指向 一 个 对 象 的 引用 的 时 候 , 从 源 区 域 转发 这 个 对 象 。 
基于 对 象 的 设计 不 仅 转发 对 象 ， 而 且 还 转发 所 有 它 引 用 的 对 象 。 用 三 色 术 语 表述 ， 基 于 
槽 位 的 设计 把 一 个 对 象 从 和 白色 转化 为 灰色 ， 而 基于 对 象 的 设计 把 一 个 白 对 象 变 为 黑 对 
象 。 对 于 并 发 区 域 复制 ， 这 两 种 方法 都 可 以 使 用 。 
引用 修正 : 扫描 堆 (除了 源 区 域 ) 来 更 新 所 有 指向 源 区 域 的 引用 。 这 些 是 指向 源 区 域 的 
跨 区 域 引 用 。 因 为 所 有 的 新 地 址 都 已 经 计算 好 了 ,所 以 引用 修正 不 需要 等 待 被 引用 的 对 
象 被 复制 。 
如 果 转 发 指针 保存 在 堆 外 的 目标 映射 表 中 , 当 一 个 区 域 的 所 有 活跃 对 象 都 被 复制 后 ,这 
个 区 域 可 以 立即 被 重用 。 剩 余 的 指向 它 的 引用 仍然 可 以 通过 目标 表 更 新 
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使 用 “目标 空间 不 变 ” 设 计 ， 如 果 一 个 引用 指向 源 区 域 ， 那 就 不 可 能 把 它 安 装 到 堆 中 ， 
所 以 这 些 白 引 用 的 总 数 是 有 限 的 ， 可 以 在 一 趟 内 修正 。 


当 修改 器 和 回收 器 都 更 新 同一 个 对 象 字段 , 而 这 个 字段 村 有 指向 源 区 域 的 引用 时 ,二 者 
之 间 可 能 有 数据 竞争 , 例如 ， 回收 器 想 要 修正 引用 值 , 使 其 指向 目标 区 域 ,而 修改 器 想 
要 更 新 这 个 引用 , 使 其 指向 另 一 个 对 象 。 为 了 避免 这 种 情况 ,回收 器 需要 用 原子 指令 执 
行 引用 修正 , 即 用 原子 的 CompareExchange 来 修正 引用 , 这 个 指令 只 有 在 旧 值 指向 源 
KIRA FARA, 否则 ， 如 果 原 子 指令 失败 ， 回 收 器 就 放弃 并 继续 ， 因 为 这 个 槽 位 或 者 
已 被 修改 器 改变 ， 或 者 已 被 其 他 回收 器 修正 。 


3. 引用 修正 趟 


在 STW 区 域 复制 中 ， 可 以 使 用 预先 建立 的 记忆 集 来 修正 跨 区 域 引 用 ， 而 不 是 通过 堆 扫描 。 
为 准备 好 一 轮 完 整 回收 , 在 每 一 对 区 域 之 间 的 所 有 跨 区 域 引用 都 应 该 被 记忆 , 这 样 可 以 回收 每 个 
区 域 。 跨 区 域 引用 可 以 通过 写 屏障 在 修改 器 的 执行 过 程 中 记忆 , 也 可 以 在 回收 器 全 堆 追 踪 过 程 中 
枚 举 。 当 移动 一 个 区 域内 的 对 象 时 ， 所 有 指向 这 个 区 域 的 引用 都 被 更 新 为 指向 它们 的 新 地 址 。 
OpenJDK 中 的 Oracle G1 回收 器 就 是 使 用 这 种 方法 的 STW 区 域 复制 式 GC. 它 采 用 独立 一 趟 全 堆 
并 发 追踪 ， 为 所 有 路 区 域 引用 建立 起 记忆 集 。 然 后 G1 使 用 STW 区 域 复制 来 回收 目标 区 域 。 

跨 区 域 记 忆 集 可 能 有 巨大 的 内 存 开销 。 堆 扫 描 可 以 通过 枚 举 堆 中 引用 酸 位 来 用 时 间 开 销 抵消 

使 用 并 发 区 域 复 制 ，G1 的 方法 是 不 方便 的 ， 不 是 因为 内 存 开销 ， 而 是 因为 修改 器 一 直 在 持 
续 地 改变 着 引用 。 没 有 稳定 的 记忆 集 。 更 直观 的 方法 是 使 用 独立 一 趟 堆 扫描 进行 引用 修正 。 

基于 上 述 讨论 ， 区 域 复制 基本 上 有 以 下 几 遍 。 

(1) 执行 全 堆 追 踪 以 找到 活跃 对 象 。 

(2) 选择 要 回收 的 区 域 ， 并 重 定位 其 中 的 活跃 对 象 。 

(3) 执行 区 域 回收 来 移动 选中 区 域 中 的 活跃 对 象 。 

(4) 执行 全 堆 扫 描 来 修正 引用 。 

注意 这 几 遍 可 以 是 全 部 独立 的 。 其 中 的 一 些 也 可 以 合并 为 一 遍 , 或 者 并 行 执 行 。 例 如 ， 如 果 
在 第 一 志和 第 二 忆 开 始 之 前 就 选 好 源 区 域 和 目标 区 域 , 那么 它们 可 以 合并 到 一 起 。 第 三 遍 和 第 四 
遍 可 以 并 行 执 行 。 

为 一 点 提醒 是 ， 这 里 的 每 一 遍 都 可 以 是 并 发 的 , 或 者 是 STW。 当 它们 都 是 STW 的 时 候 ,， 这 
个 算法 就 退化 成 了 LISP2 压缩 ， 其 中 的 选中 区 域 实际 上 就 是 整个 堆 。 

然而 要 扫描 整个 堆 来 进行 引用 修正 , 回收 器 可 以 在 每 个 区 域 中 逐个 枚 举 活路 对象 , 也 可 以 像 
活跃 对 象 标记 所 做 的 那样 追踪 堆 。Azul 的 C4 算法 提出 把 下 一 次 回收 的 活跃 对 象 标记 遍 次 结合 到 
这 一 次 回收 的 引用 修正 遍 次 ， 称 为 “连续 回收 器 ”。 
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(1) 执行 全 堆 追 踪 来 找到 活跃 对 象 ， 并 修正 指向 旧 值 的 引用 。 

(2) 选择 回收 区 域 ， 并 重 定位 其 中 的 活跃 对 象 。 

(3) 执行 区 域 回收 来 移动 选中 区 域 中 的 活跃 对 象 。 

(4) 回 到 步骤 (1)。 

这 样 回收 就 变 成 了 无 休止 且 无 暂停 的 ,一 次 回收 一 个 或 多 个 区 域 。 在 并 发 移动 式 回收 中 , 使 
用 整个 堆 作为 选中 区 域 是 不 可 能 的 , 需要 一 个 空闲 保留 区 域 来 持 有 新 副本 , 这 样 修改 器 和 回收 器 
才能 在 不 同 的 副本 上 并 行 工作 。 


17.5.2 ”基于 虚拟 内 存 的 并 发 压缩 

和 以 前 一 样 ， 可 以 利用 操作 系统 (OS ) 的 虚拟 内 存 支持 帮助 实现 并 发 压缩 中 的 对 象 复制 。 

1. 需 读 屏障 配合 的 异常 处 理 函 数 

这 是 一 个 使 用 “目标 空间 不 变 ” 的 设计 。 在 并 发 复制 开始 之 前 , 源 区 域 中 的 所 有 活跃 对 象 都 
已 经 被 重 定位 ， 也 就 是 说 ， 它 们 在 目标 空间 的 新 地 址 已 经 被 计算 好 了 。 

目标 区 域 是 被 内 存 保护 的 , 它 的 物理 页 面 经 过 两 次 映射 。 一 个 虚拟 地 址 映射 在 被 访问 时 会 触 
发 页 面 异 常 ， 另 一 个 映射 允许 异常 处 理 函 数 访问 这 个 被 保护 页 面 。 

作为 并 发 复制 的 第 一 步 , 翻转 阶段 把 那些 指向 源 区 域 的 根 集 引 用 修正 为 指向 目标 区 域 。 打开 
一 个 读 屏障 来 防止 修改 器 看 到 指向 源 空间 的 引用 ,然后 所 有 的 修改 器 恢复 并 继续 执行 。 这 些 步 又 
和 之 前 一 样 ， 区 别 在 于 读 屏 障 。 之 前 ， 如 果 一 个 对 象 还 没有 转发 ， 读 屏障 会 转发 它 。 现 在 读 屏 障 
不 会 转发 它 ， 而 是 返回 它 在 目标 区 域 的 新 地 址 。 

当 修改 器 访问 目标 区 域 的 对 象 时, 会 触发 一 个 页 面 异常 。 处理 函数 会 把 重 定位 的 对 象 复制 到 
异常 页 面 中 。 这 个 处 理 函数 需要 能 够 找到 映射 到 异常 页 面 的 第 一 个 源 对 象 , 然后 线性 地 得 到 其 他 
映射 到 异常 页 面 的 源 对 象 。 一 旦 所 有 到 这 个 页 面 的 对 象 都 被 复制 ， 就 可 以 移 除 保 护 了 。 

这 个 设计 中 ， 可 以 用 如 下 方式 定义 三 色 术语 。 

(1) 源 区 域 的 活跃 对 象 都 默认 为 白色 。 

(2) 如 果 一 个 对 象 包含 指向 源 区 域 的 引用 ， 这 个 对 象 是 灰色 的 。 

(3) 目标 区 域 的 对 象 是 黑色 的 。 


需要 读 屏 障 来 防止 修改 器 访问 源 区 域 中 的 对 象 , 但 允许 访问 其 他 区 域 。 内 存 保护 是 为 了 防止 
修改 器 访问 目标 空间 中 未 复制 的 对 象 。 下 面 的 伪 代 码 给 出 了 读 屏 障 和 异常 处 理 函 数 的 实现 。 
Object* read_barrier_slot (Object* src, Object** slot) 
{ 
Object* obj = *slot; 
if( in_from_region(obj) ){ 
obj = forwarding_pointer (obj); 
*slot = obj; 
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} 
return obj; 


} 


void fault_handler_copy_region(void* addr) 
{ 
Page* fault_page = page_of_addr (addr) ; 
lock_page_copy (fault_page) ; 
if( !is_protected(fault_page) ) return; 
// 把 页 面 从 灰色 变 为 黑色 
// 找到 源 区 域 中 映射 到 异常 页 面 的 第 一 个 对 象 的 对 象 
Object* src = first_source_obj_to_page(fault_page) ; 
Object* dst = forwarding_pointer(src); 
Page* dst_page = page_of_addr(dst); 
while( dst_page == fault_page ) { 
reference_fix(src); 
obj_copy (src) ; 
sre = next_obj_in_region(src); 
dst = forwarding_pointer(src); 
dst_page = page_of_addr(dst); 





} 
unprotect (fault_page) ; 
unlock_page_copy (fault_page) ; 


一 个 页 面 只 被 异常 处 理 函 数 处 理 一 次 , 它 把 所 有 重 定位 到 该 页 面 的 对 象 复制 到 这 个 页 面 。 在 
页 面 复 制 的 过 程 中 ,这 个 页 面 是 被 锁定 的 ,所 以 只 有 一 个 线程 可 以 将 对 象 复制 到 它 上 面 。 在 同一 
个 页 面 陷 入 异常 的 其 他 修改 如 会 等 待 这 个 锁 直 到 复制 结束 。 


注意 , 当 一 个 对 象 被 复制 的 时 候 , 它 包含 的 所 有 引用 都 同时 被 修正 , 并 不 复制 被 引用 的 对 象 。 
这 是 可 外 “ih, 因为 在 复制 开始 之 前 就 知道 了 所 有 的 新 地 址 。 没 有 额外 的 用 于 引用 修正 的 步骤 来 扫 
描 目 标 区 域 对 象 . 但 是 , 回收 器 应 该 同时 工作 来 修正 目标 区 域 和 源 区 域 之 外 的 其 他 区 域 中 的 引用 。 

2. 不 需 读 屏 障 配 合 的 异常 处 理 函 数 

上 面 的 设计 需要 使 用 编译 器 插 桩 的 读 屏障 来 防止 修改 器 访问 源 区 域 中 的 对 象 。 其 他 区 域 ( 除 
了 目标 区 域 ) 中 可 能 存在 包含 指向 源 区 域 的 引用 ( 即 白 引用 ) 的 灰 对 象 。 当 修改 器 访问 灰 对 象 时 ， 
需要 读 屏 障 来 防止 它们 看 到 白 引 用 。 

然而 ， 如 果 通 过 设计 让 修改 器 只 能 看 到 黑 对 象 ， 那 么 它们 就 没有 机 会 看 到 白 引 用 ， 因 此 就 
可 以 省 略 读 屏 障 。 

为 了 让 修改 器 只 能 看 到 黑 对 象 , 我 们 可 以 应 用 Appel 等 人 提出 的 基于 VM 的 并 发 复制 的 原始 
思路 ， 其 中 堆 被 分 割 为 源 区 域 和 目标 区 域 。 堆 中 没有 其 他 区 域 。 修 改 器 只 能 访问 目标 区 域 。 

这 里 的 设计 仍然 使 用 半空 间 , 一 半 用 作 源 空间 ， 男 一 半 用 作 目 标 空间 。 与 原始 设计 思路 的 区 


别 在 于 ,为 了 实现 并 发 压缩 , 它们 是 虚拟 地 址 空间 。 源 空间 完全 映射 到 物理 地 址 空间 ,目标 空间 
则 不 是 这 样 。 目标 空间 中 只 有 保留 的 空闲 区 域 映 射 到 物理 地 址 。 目 标 空间 的 其 余 区 域 在 修改 顺 向 
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其 复制 对 象 的 时 候 按 需 映射 。 我 们 称 之 为 “虚拟 半空 间 ”。 
图 17-5 展示 了 半空 间 、 区 域 复制 和 虚拟 半空 间 这 三 种 并 发 移动 算法 的 区 别 。 
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图 17-5 并 发 移动 算法 的 区 别 


在 虚拟 半空 间 算法 中 , 如 果 源 空间 的 一 个 区 域 中 的 所 有 对 象 都 已 被 复制 , 那么 这 个 区 域 的 物 
理 页 面 可 以 被 释放 。 它 们 可 以 被 目标 空间 重用 ， 以 复制 更 多 的 对 象 。 整 个 回收 过 程 中 , 源 空 间 的 
物理 页 面 一 个 区 域 接 一 个 区 域 地 被 释放 , 同时 它们 一 个 区 域 接 一 个 区 域 地 被 映射 到 目标 空间 。 通 
过 这 种 方式 , 我 们 只 用 相对 小 的 保留 空闲 空间 就 可 以 获得 半空 间 复制 式 回 收 的 效果 , 从 而 也 得 到 
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类 似 于 压缩 回收 的 结果 。 一 个 直观 实现 可 能 看 起 来 如 下 所 示 。 


在 空间 翻转 之 后 ， 修 改 器 的 所 有 引用 都 指向 目标 空间 ， 它 的 整个 虚拟 空间 是 被 内 存 保护 的 ， 
只 有 一 个 区 域 被 物理 映射 作为 种 子 空 闪 区 域 。 对 目标 空间 中 页 面 的 访问 会 触发 异常 处 理 函 数 , 它 
会 把 引用 的 对 象 转发 ， 因此 也 映射 了 物理 页 面 。 


当 一 个 对 象 被 复制 到 目标 空间 后 , 它 包 含 的 所 有 引用 都 被 一 起 修正 , 因为 所 有 白 对 象 的 新 地 
址 都 已 经 提前 计算 出 来 。 所 以 目标 空间 的 对 象 只 有 指向 目标 空间 的 引用 。 当 修改 器 访问 一 个 被 引 
用 但 还 没有 被 复制 的 对 象 时 ,会 再 次 触发 异常 处 理 函 数 。 由 此 得 出 两 点 推论 : 


(1) 修改 器 永远 不 会 访问 源 空间 ， 因 此 也 不 需要 读 屏 障 ; 
(2) 修改 融 对 目标 空间 的 访问 可 能 触发 大 量 页 面 异 常 ， 直 到 所 有 白 对 象 都 被 复制 为 止 。 


同时 ,回收 顷 扫 描 目 标 空间 的 页 面 来 转发 白 对 象 。 这 可 以 加 速 回 收 ,并 缓解 修改 器 复制 对 象 
的 负担 。 

这 个 设计 可 以 按 需 分 配 目标 空间 页 面 , 但 是 它 不 一 定 能 按照 期 望 释放 源 空间 中 的 页 面 , 因为 
要 复制 的 对 象 由 从 根 集 的 可 达 路 和 人 痉 间 中 的 原始 副本 
不 一 定 聚 集 在 同一 个 页 面 或 同一 个 区 域 中 。 它们 可 能 分 散在 源 空间 中 。 有 可 能 在 目标 空间 中 分 配 
了 很 多 页 面 之 后 还 没有 释放 任何 源 空 间 中 的 页 面 。 这 增加 了 对 物理 映射 页 面 的 需求 。 在 最 差 的 情 
况 下 ， 可 能 它 所 需 的 物理 页 面 的 总 大 小 几乎 是 源 空间 大 小 的 两 倍 ， 这 本 质 上 就 把 “虚拟 半空 间 ” 
算法 转化 为 了 真正 的 半空 间 算法 。 

为 了 释放 源 空间 页 面 , 一 个 页 面 中 的 对 象 应 该 被 一 起 转发 。 这 需要 把 页 面 作为 基本 复制 单元 
来 处 理 。 也 就 是 当 修改 天 在 目标 空间 中 复制 一 个 被 访问 对 象 的 时 候 , 它 找到 原来 白 对 象 所 在 的 源 
空间 中 的 页 面 ， 然 后 把 这 个 页 面 中 的 所 有 活跃 对 象 都 复制 到 目标 空间 。 

3. 虚拟 半空 间 实 现 

基于 前 面 的 考虑 ， 一 个 完整 的 虚拟 半空 间 设计 如 下 所 示 。GC 首先 追踪 整个 堆 ， gee 
性 顺序 遍历 堆 来 计算 所 有 活跃 对 象 在 目标 空间 的 新 地 址 , 就 像 滑动 压缩 算法 所 做 的 那样 , 但 是 


不 真 的 复制 它们 。 目 标 空 间 是 被 保护 的 , 除了 保留 页 面 之 外 都 只 raise 
转 操作 ， 把 所 有 根 集 引 用 重 定位 到 目标 空间 ， 然 后 恢复 修改 器 。 


修改 上 硕 只 能 看 到 指向 目标 空间 的 引用 。 当 修改 融 解 引用 一 个 地 址 ， 而 这 个 地 址 还 没有 被 物理 
映射 时 ， 会 触发 一 个 页 面 异 常 ， 然 后 异常 处 理 函 数 复制 目标 为 异常 页 面 的 所 有 活跃 对 象 。 因 为 活 
跃 对 象 的 新 地 址 是 以 线性 顺序 计算 的 , 所 以 被 转发 对 象 的 原始 副本 聚集 在 一 个 或 多 个 页 面 里 。 复 
制 完成 后 ,异常 页 面 被 解除 保护 。 既 然 这 些 源 页 面 上 的 活跃 对 象 已 经 被 转发 了 ,就 可 以 释放 它们 
了 。 通 过 这 种 方式 ， 可 以 获得 期 望 的 就 地 压缩 结果 。 


下 面 给 出 异常 处 理 盟 数 的 伪 代 码 。 这 与 之 前 给 出 的 并 发 代码 非常 相似 , 但 虚拟 半空 间 不 需要 
读 屏 障 。 


void fault_handler_copy_to(void* addr) 
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Page* fault_page = page_of_addr (addr); 
lock_page_scan(fault_page) ; 

if( !is_protected(fault_page) ) return; 

// 把 页 面 从 copy-gray 变 为 copy-black 

// 找到 转发 到 fault_page 的 源 对 象 范围 

Page* next_page = next_page_after(fault_page) ; 

Object* src_obj_start = first_source_obj_to_page(fault_page) ; 
Object* src_obj_end = first_source_obj_to_page (next_page) ; 


Objéct* src = src_obj_start;> 
while( src < src_obj_end ) { 

reference_fix(src); 

obj_copy (src) ; 

src = next_obj_after(src); 
} 
unprotect (fault_page) ; 
unlock_page_scan(fault_page) ; 
release_pages_between(src_obj_start, src_obj_end) ; 


} 

在 这 个 设计 中 , 目标 空间 的 目标 页 需要 知道 它 第 一 个 对 象 的 原始 副本 在 源 空 间 的 地 址 。 这 个 
信息 由 GC 在 对 象 重 定位 那 一 趟 中 记录 ,也 就 是 回收 器 计算 活跃 对 象 的 目标 地 址 时 。 在 翻转 阶段 

结束 后 ,修改 器 恢复 运行 时 ， 回 收费 开始 通过 逐个 遍历 目标 空间 页 来 复制 这 些 对 象 。Kermany 和 

Petrank 提出 了 这 个 被 他 们 称 为 Compressor 的 原始 设计 。 

下 面 是 这 个 设计 的 几 趟 操作 的 概念 化 描述 。 

(1) 追踪 整个 堆 找到 活跃 对 象 。 

(2) 重 定 位 所 有 活跃 对 象 。 

(3) 翻转 空间 ， 复 制 活跃 对 象 到 目标 空间 并 修正 引用 。 

在 堆 追 踪 趟 之 后 分 配 的 新 对 象 无 法 被 追踪 , 应 该 在 目标 空间 中 作为 活跃 对 象 被 分 配 。 如 果 它 
们 在 翻转 阶段 之 前 被 分 配 ,它们 可 能 包含 指向 源 空 ae: 所 以 这 些 新 对 象 也 应 该 被 内 存 保护 ， 
以 防止 它们 的 引用 逃逸 。 当 修改 器 访问 它们 的 时 候 ， 异 常 处 理 函 数 修正 它们 的 引用 并 移 除 保护 。 


这 个 设计 保持 了 压缩 的 滑动 属性 。 但 它 和 其 他 “目标 空间 不 变 ” 设 计 同 样 有 一 个 “对 象 移动 
风暴 ”的 问题 。 修 改 顷 恢复 之 后 ,它们 有 可 能 被 大 量 页 面 异 常 和 对 象 复制 所 占据 ， 以 至 于 几乎 无 
法 推进 。 在 极端 情况 下 ， 复 制 阶段 可 能 有 一 小 段 时 间 看 起 来 就 像 STW 一 样 。 随 着 越 来 越 多 的 对 
象 被 复制 ， 修 改 器 才 可 以 向 前 推进 ， 然 后 回收 就 越 来 越 像 增 量 式 的 。 整 体 看 来 ， 虚 拟 半空 间 感 觉 
到 的 暂停 时 间 可 能 比 一 个 真正 的 STW 压缩 明显 短 得 多 。 


4. 并 发 就 地 压缩 
显然 ， 压缩 回收 可 以 使 用 其 他 并 发 复制 技术 ， 比 如 “当前 副本 不 变 ” 或 者 “ 源 空间 不 变 ” 
计 。 这 里 不 讨论 它们 。 
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前 面 的 压缩 算法 不 完全 是 就 地 的 。 它 们 都 需要 一 个 空闲 保留 区 域 来 回收 第 一 个 使 用 区 域 , 而 
ee 
制式 回收 ， 在 源 空 间 可 以 被 释放 之 前 ， 需 要 一 个 目标 空间 来 持 有 被 移动 的 对 象 。 


这 样 做 的 根本 原因 是 ,与 并 发 移动 式 回收 一 样 , 在 对 象 被 移动 的 同时 ， 它 应 该 确保 修改 带 总 
是 访问 有 效 数据 。 使 用 一 个 空 闻 保留 区 域 也 很 方便 ， 这样 不 必 担 心 对 象 移动 覆 盖 有 效 数据 。 


A 就 像 在 半空 间或 者 虚拟 半空 间 算法 中 那样 。 它 也 可 以 只 
有 单个 页 面 那么 小 ,甚至 还 可 以 更 小 ， 只 要 能 容纳 回收 区 域 中 的 最 大 对 象 即 可 。 在 现实 中 , 空闲 
保留 区 域 的 大 小 应 该 足以 获得 合 理 的 回收 春 吐 量 。 


不 管 保 留 区 域 有 多 么 小 , 这 都 不 是 严格 意义 上 的 就 地 回收 。 严格 就 地 回收 允许 在 堆 中 滑动 对 
象 一 点 点 ,但 不 超过 这 个 对 象 的 大 小 。 严 格 并 发 压缩 也 是 可 以 实现 的 。 


例如 ，GC 可 以 并 发 地 逐个 把 活跃 对 象 滑动 到 堆 尾 。 移 动 对 象 的 操作 对 修改 器 操作 来 说 是 原 
子 的 ， 这 样 修改 器 只 能 在 移动 前 或 者 移动 后 访问 这 个 对 象 。 当 修改 器 试图 访问 一 个 对 象 的 时 候 ， 
一 个 访问 屏障 会 拦截 这 个 访问 ， 并 检查 这 个 对 象 是 已 经 移动 完毕 还 是 正在 移动 中 。 


(1) 如 果 是 在 移动 前 ， 返 回 对 象 的 原来 地 址 。 
(2) 如 果 正 在 移动 中 ， 阻 塞 这 个 修改 器 等 待 移动 完成 。 
(3) 如 果 已 经 移动 完毕 ， 返 回 这 个 对 象 的 新 地 址 。 


修改 器 并 不 移动 对 象 。 原 因 在 于 , 修改 器 不 知道 对 象 压缩 的 顺序 (或 者 它 不 想 卷 人 这 个 麻烦 
中 )。 回 收 咒 以 滑动 方式 移动 对 象 。 它 们 必须 精确 地 控制 顺序 ， 这 样 才 不 会 覆盖 有 效 数据 。 我 们 
开发 的 用 于 并 行 压缩 的 算法 也 可 以 应 用 在 这 里 ,但 需要 对 移动 中 的 对 象 加 一 个 锁 。 


这 个 设计 需要 使 用 一 个 目标 映射 表 来 指示 对 象 移动 状态 , 因为 一 个 被 移动 对 象 的 原始 副本 可 
能 已 经 被 覆盖 了 ,所 以 无 法 在 它 的 对 象 头 中 维护 转发 指针 。 那 么 接 下 来 的 一 个 问题 就 是 ,如果 恰 
好 移出 的 旧 对 象 和 移入 的 新 对 象 位 于 相同 地 址 的 话 , 那么 访问 屏障 如 何 知道 这 个 引用 是 用 于 访问 
已 经 被 移 走 的 旧 对 象 , 还 是 用 于 刚 移入 的 当前 对 象 。 一 个 解决 方案 是 用 不 同 的 虚拟 地 址 空间 来 区 
分 它们 。 也 就 是 说 ， 堆 被 映射 到 两 个 不 连续 的 虚拟 地 址 范围 ， 比 如 源 范围 和 目标 范围 。 源 范围 中 
的 引用 是 用 于 访问 旧 对 象 的 ， 目 标 范围 的 引用 是 用 于 访问 新 位 置 中 的 对 象 的 。 


这 个 读 屏障 和 写 屏 障 的 伪 代 码 给 出 如 下 。 


Value read_barrier_current (Object* obj, int field) 
{ 

return access_barrier(obj, field, 0, IS_READ); 
} 


void write_barrier_current (Object* obj, int field, Value val) 
{ 
bool fld_is_ref = field_is_ref(field); 
// 向 字段 写 入 新 地 址 ， 这 是 必需 的 
if(fld_is_ref && in_from_range(val) && is_forwarded(val) ) 
val = forwarding_pointer(val); 
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access_barrier(obj, field, val, IS_WRITE); 
} 


Value access_barrier(Object* obj, int field, Value val, int acc_type) 
{ 
if( in_from_range(obj) ) { 
if( !is_forwarded(obj) ){ 
bool success = lock_forwarding (obj); 
if( success ) { 
Value ret = object_access(obj, field, val, acc type); 
unlock_forwarding (obj); 
return ret; 
jelse{ 
while( !is_forwarded(obj) ); 
} 
} 
// 对 象 已 被 转发 
obj = forwarding_pointer(obj); 
} 
return object_access(obj, field, val, acc_type); 
} 


这 个 写 屏 障 代码 与 “当前 副本 不 变 ” 写 屏障 相同 。 这 是 合理 的 ， 因 为 修改 天 并 不 想 亲 目 移 动 
对 象 。 为 了 避免 移动 对 象 ， 如果 对 象 还 没有 被 移动 的 话 ， 修 改 器 应 该 访问 它 的 原始 副本 ; 如 果 对 
象 已 被 移动 或 者 在 移动 中 , 就 需要 访问 它 的 新 副本 。 指向 原始 副本 和 新 副本 的 引用 都 可 能 出 现在 
修改 天 的 上 下 文中 。 


当 一 个 对 象 在 移动 中 时 ,修改 器 可 以 等 待 这 个 对 象 移动 结束 .但 是 如 果 这 个 对 象 还 没有 移动 ， 
修改 器 就 不 能 等 待 它 移动 ， 因 为 它 不 知道 移动 何 时 开始 。 否 则 ， 结 果 就 会 退化 为 STW。 如 果 对 
象 还 没有 被 移动 ， 修 改 器 应 该 就 访问 它 的 原始 副本 。 注 意 ， 修 改 器 可 以 获得 移动 锁 , 但 只 是 用 于 
防止 回收 器 移动 这 个 对 象 。 

上 面 的 读 屏 障 代码 与 “当前 副本 不 变 ” 读 屏 障 有 所 不 同 。“ 当 前 副本 不 变 ” 读 屏障 比 写 屏 障 
简单 得 多 ， 而 这 里 的 读 屏障 几乎 和 写 屏障 一 样 。 在 “当前 副本 不 变 ”的 读 屏 障 中 ,根据 对 象 是 否 
已 被 移动 ， 修 改 器 或 者 读 取 旧 副本 ， 或 者 读 取 新 副本 。 它 不 会 锁定 对 象 转发 ， 也 不 会 等 待 对 象 转 
发 完成 。 这 是 有 无 空闲 保留 空间 的 GC 之 间 的 关键 区 别 。 

当 GC 使 用 空闲 保留 空间 的 时 候 ， 有 
副本 可 以 只 被 标记 为 “已 转发 "。 在 此 之 前 ， 旧 副本 都 是 有 效 的 ， 因 为 不 会 有 对 转发 中 对 象 执行 
的 写 操作 。 这 意味 着 在 对 象 处 于 移动 之 中 的 时 候 ， 修改 器 访问 旧 副 本 是 安全 的 。 它 不 需要 等 ae 
动 完成 。 另 外 ,既然 修改 器 读 和 回收 器 移动 可 以 并 行 执行 ,它们 之 间 不 需要 互 斥 。 修 改 器 不 需 
锁定 对 象 来 读 取 。 这 与 就 地 压缩 算法 不 同 。 


， 就 地 压缩 没有 空闲 保留 区 ,所 以 对 一 个 对 象 的 移动 有 可 能 只 是 把 它 滑 动 一 点 点 ， 新 副 


eR TO 
效 了 。 为 了 访问 到 正确 的 数据 ， 修 改 器 需要 锁定 这 个 对 象 防止 它 移动 。 
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注意 ， 当 对 象 被 移动 后 ， 它 的 引用 并 没有 都 被 修正 为 指向 目标 空间 的 新 地 址 ， 尽 管 在 对 象 重 
定位 趟 之 后 已 经 可 以 得 到 所 有 新 地 址 。 它 只 修正 引用 对 象 已 经 被 移动 的 那些 引用 。 否则 ， 如 果 一 
个 对 象 还 没有 被 移动 ， 修 改 器 无 法 在 它 的 新 地 址 得 到 它 的 数据 。 

出 于 这 个 原因 ,在 所 有 对 象 被 移动 后 ， 需 要 一 趟 引用 修正 。 在 此 之 前 ,修改 器 可 能 需要 通过 
目标 映射 表 间 接 访 问 到 当前 副本 , 并 更 新 加 载 的 包含 过 时 引用 的 引用 字段 。 另 一 个 解决 方案 是 在 
堆 追 踪 趟 为 每 个 对 象 建立 一 个 记忆 集 。 然 后 每 当 移动 一 个 对 象 的 时 候 , 回收 器 可 以 更 新 记忆 集中 
的 槽 位 。 这 会 导致 巨大 的 内 存 开 销 ,， 并 且 一 个 对 象 的 记忆 集 大 小 是 可 变 的 ， 因为 修改 器 可 能 把 它 
的 引用 写 到 多 个 位 置 。 第 19 章 将 讨论 这 个 解决 方案 。 

这 个 设计 的 各 趟 概念 表示 如 下 。 

(1) 追踪 整个 堆 找 到 活跃 对 象 。 

(2) 重 定位 所 有 活跃 对 象 。 

(3) 滑动 复制 对 象 到 新 位 置 。 

(4) 修正 引用 。 

到 目前 为 止 , 我 们 已 经 开发 了 一 个 并 发 就 地 压缩 算法 ,但 是 它 几乎 是 不 实用 的 。 一 个 原因 是 
消除 空闲 保留 空间 并 没有 带 来 明显 的 益处 。 并 发 回收 需要 允许 新 对 象 分 配 ， 而 新 对 象 分 配 需要 空 
闲 空 间 。 回 收 需要 的 时 间 越 长 ， 为 新 对 象 保 留 的 空闲 空间 就 应 该 越 大 。 严格 并 发 就 地 压缩 的 运行 
时 间 比 非 严 格 并 发 就 地 压缩 要 长 得 多 。 尽 管 它 消除 了 为 存活 对 象 保留 的 空闲 空间 , 但 是 需要 为 新 
对 象 保留 更 大 的 空闲 空间 。 只 有 在 应 用 程序 有 很 高 的 生存 率 和 很 低 的 分 配 率 的 时 候 , 这 么 做 才 有 
意义 。 
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除了 垃圾 回收 之 外 ， 另 一 个 显著 影响 虚拟 机 CVM ) 性 能 的 核心 组 件 是 线程 同步 。 

Java 通过 monitor 和 原子 进行 线程 同步 。 如 果 应 用 程序 频繁 使 用 同步 的 话 ，monitor 的 实现 对 
其 性 能 有 很 大 影响 。 有 些 应 用 程序 可 能 通过 库 隐 式 地 使 用 同步 。 

我 们 已 经 讨论 过 一 个 最 简单 形式 的 monitor 实现 ， 以 解释 它 的 工作 原理 。 在 这 一 章 里 ,我 们 
会 讨论 能 够 大 幅度 降低 monitor 运行 开销 的 更 实际 的 实现 。 在 下 面 的 章节 中 ， 锁 和 monitor 可 以 
互 换 使 用 ， 除 非 另 行 指出 。 


18.1 EIEH 


锁 只 对 于 多 线程 计算 有 意义 。 如 果 已 经 知道 系统 中 只 有 一 个 活跃 线程 , 或 者 一 个 锁 只 被 单个 
线程 访问 ， 那 么 不 需要 实际 执行 锁 操作 。 

要 检查 系统 是 否 为 单线 程 可 以 很 简单 。 在 线程 管理 器 中 , 有 一 个 计数 器 用 于 追踪 创建 线程 的 
数量 。 这 种 方法 不 适用 于 锁 优化 ， 因 为 当前 JVM 实现 通常 有 多 个 VM 创建 的 线程 ， 比 如 用 于 即 
时 编译 、 垃 圾 回收 和 终结 的 线程 。 

一 个 更 好 的 设计 不 是 检查 创建 的 线程 数量 ,而 是 检查 访问 锁 的 线程 数量 。 在 第 二 个 线程 访问 
锁 之 前 ， 应 用 程序 不 需要 执行 锁 操 作 。 为 了 确保 其 正确 性 ， 所 有 的 锁 操 作 都 被 记录 下 来 。 当 第 二 
个 线程 将 要 使 用 一 个 锁 的 时 候 ， 记 录 的 锁 操作 被 实际 执行 ， 这 个 思路 称 为 “惰性 锁 "。 

要 实现 惰性 锁 ， 可 以 用 一 个 “惰性 锁 列表 ”记录 锁 操作 ， 如 图 18-1 所 示 。 
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对 象 1 
一 个 线程 的 锁 操 作 
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锁定 () = ee 
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图 18-1 记录 应 该 被 锁定 对 象 的 惰性 列表 

下 面 给 出 实现 惰性 锁 的 伪 代 码 ， 其 中 使 用 一 个 对 象 数组 作为 惰性 锁 列 表 。 
/* 情 性 列表 */ 

Object* lazy_list[]; 


/* 记录 被 记录 对 象 的 数量 */ 


int lazy_lock_num = 0; 


随 着 应 用 程序 执行 惰性 列表 的 变化 





/* 用 于 单个 线程 锁定 */ 
void lazy_lock ( Object* obj ) 
{ 
lazy_list [lazy_lock_num++] = obj; 
} 


/* 用 于 单个 线程 解锁 */ 
void lazy_unlock( Object* obj ) 
{ 
lazy_lock_num--; 
if( lazy_list[lazy_lock_num] != obj ){ 
vm_throw_exception("IllegalMonitorState") ; 
} 
} 
/* 在 第 二 个 线程 锁定 任何 对 象 之 前 
惰性 锁定 记录 的 对 象 */ 
void lock_lazily() 
{ ”// 恢复 普通 锁 实 现代 码 
retore_normal_lock_code(); 
// vm_object_lock() © MFA zZ tj API 
// 它 现 在 调用 普通 实现 代码 
for(int i=0; i<lazy_lock_num; i++ ){ 
vm_object_lock( lazy_list[i] ); 
} 
} 


当 第 二 个 线程 试图 锁定 的 时 候 ， 或 者 系统 调用 Object .wait () 的 时 候 ， lock_lazily() 18. 
会 被 调用 来 恢复 锁 状 态 。 


如 果 在 惰性 列表 中 记录 对 象 的 话 ，GC 模块 应 该 把 这 个 列表 作为 全 局 根 集 的 一 部 分 进行 枚 举 . 
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18.2 fet 

惰性 锁 只 能 提高 单线 程 性 能 。 对 于 多 线程 锁定 ， 我 们 采用 其 他 优化 技术 。 

比如 ， 在 第 6 章 的 第 一 个 monitor 实现 中 ， 我 们 使 用 了 线程 局 部 的 locked_object_list 
数据 结构 来 追踪 被 一 个 线程 锁定 的 monitor。 它 要 求 每 次 锁定 和 解锁 ( 即 monitorenter 和 
monitorexit ) 操作 都 搜索 这 个 列表 , 这 是 昂贵 的 。 如 果 锁 定 / 解 锁 操 作 在 应 用 程序 中 非常 密集 ， 
代价 可 能 会 很 大 。 

这 一 节 会 分 析 锁 定 /解锁 的 执行 路 径 ， 然 后 继续 提出 一 些 方法 对 热 路 径 进 行 优化 。 





18.2.1 EMMER 
一 个 monitor 锁定 过 程 主要 有 以 下 操作 。 
O 步骤 1: 检查 这 个 monitor 是 否 已 被 锁定 。 
O 步骤 2: 如 果 这 个 monitor 没有 锁定 ， 那 么 锁定 它 并 返回 。 
O 步骤 3: 如 果 这 个 monitor 已 被 锁定 ， 检 查 它 是 否 被 自身 锁定 。 如 果 是 的 话 ， 增 加 递归 次 
数 并 返回 。 
口 步骤 4: 如 果 这 个 monitor 被 其 他 线程 锁定 ， 等 待 以 后 再 次 锁定 它 。 
图 18-2 展示 了 锁定 的 执行 流程 。 
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图 18-2 ”锁定 一 个 monitor 的 操作 流程 
在 第 一 个 实现 中 ， 除 了 步骤 1， 其 余 所 有 步 又 都 需要 列表 操作 来 管理 monitor 状态 。 步 又 4 
从 本 质 上 说 就 是 慢 路 径 , 因为 它 必 须 处 理 多 线程 锁定 竞争 , 这 通常 会 涉及 用 于 线程 调度 和 通信 的 
OS 调用 。 
现实 中 ,多 数 多 线程 应 用 程序 实际 上 并 没有 锁 竞 争 。 即 使 是 多 个 线程 访问 同一 个 锁 对 象 , E 
们 的 锁定 时 段 也 可 能 并 不 重 秋 ,这 意味 着 , 当 一 个 线程 试图 锁定 一 个 monitor 的 时 候 ,这 个 monitor 
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通常 处 于 未 锁定 状态 。 基 于 这 个 观察 结果 , 优化 思路 是 是 让 这 个 常用 路 径 快 速 执行 , 这 多 数 是 通 
向 步骤 2 的 路 径 ， 有 时 候 也 通 向 步骤 3, 在 图 18-2 中 的 操作 流程 图 上 用 箭头 的 宽度 表示 。 接 下 来 


我 们 一 个 接 一 个 地 查看 这 些 步骤 。 
步骤 1: 检查 这 个 monitor 是 否 已 被 锁定 。 
在 初始 实现 中 ,通过 检查 对 象 头 中 的 一 个 位 ， 这 个 步骤 实现 得 足够 快 。 通 过 检查 对 象 引 
A ( 即 一 个 指针 ) 中 的 一 位 ， 不 需要 加 载 对 象 头 ， 甚 至 可 以 进一步 加 速 这 个 步骤 。 
既然 步骤 1 之 后 总 是 接着 步骤 2 或 者 步骤 3， 引 用 位 模式 应 该 也 可 以 编码 一 些 步 骤 2 或 
步骤 3 使 用 的 信息 。 


在 引用 中 放 入 一 个 位 不 一 定 方便 ， BARAT RE AIRY RP EHS A 8) Mo 这 
里 我 们 不 讨论 引用 位 模式 优化 ， 而 只 讨论 使 用 对 象 头 的 信息 进行 优化 

步骤 2: 如 果 这 个 monitor 没有 锁定 ， 锁 定 它 并 返回 。 

锁定 一 个 monitor 通常 涉及 用 原子 指令 来 测试 并 设置 对 象 头 中 的 位 。 同 时 还 需要 记忆 这 
个 锁 的 拥有 者 ,这样 后 续 对 同一 个 对 象 的 锁定 可 以 了 解 是 否 由 同一 个 线程 锁定 。 锁 拥有 
者 的 信息 ( 即 线程 ID ) 需要 与 这 个 对 象 ( 即 对 象 ID ) 关联 起 来 。 

在 初始 monitor 实现 中 ， 我 们 使 用 了 线程 局 部 的 locked_object_list 来 记忆 锁定 的 
对 象 。 这 就 把 对 象 ID 存储 在 了 线程 数据 结构 中 ， 于 是 也 就 与 线程 ID 关联 起 来 。 

反 向 的 关联 是 在 锁定 的 对 象 中 记忆 线程 ID， 然 后 锁定 线程 可 以 通过 读 取 对 象 数 据 来 检 
查 当 前 拥有 者 ， 而 不 是 通过 搜索 locked_object_1ist。 了 既然 每 个 锁 的 拥有 者 不 能 多 
于 一 个 ， 那 么 在 对 象 头 中 保留 一 些 空间 给 线程 ID 是 可 行 的 。 


这 个 设计 使 得 常用 路 径 可 以 快速 锁定 一 个 空闲 monitor, 通 过 把 线程 ID 放 入 对 象 中 ,VM 
实际 上 不 知道 一 个 线程 当前 持 有 哪些 锁 ， 因 为 检查 所 有 对 象 的 锁 拥 有 者 信息 过 于 昂贵 。 
幸运 的 是 通常 不 需要 这 个 支持 。 


步骤 3: WR monitor 已 经 锁定 ， 检 查 它 是 否 由 自身 锁定 。 如 果 是 的 话 ， 增 加 递归 次 数 
然后 返回 。 


在 初始 的 实现 中 ,为 了 检查 自己 是 不 是 锁 拥 有 者 ， 线 程 在 locked_object_list 中 搜 
索 这 个 对 象 。 如 果 把 锁 拥 有 者 的 线程 ID 保存 在 对 象 头 中 ， 这 个 检查 可 以 快 得 多 。 但 如 
果 把 递归 次 数 放 在 别 的 地 方 ， 比 如 放 在 locked_object_list 中 , 快速 检查 拥有 者 没 
有 太 多 帮助 ， 因 为 如 果 对 象 被 自身 锁定 ， 那 么 之 后 线程 还 需要 访问 这 个 列表 。 如 果 我 们 
想 要 让 这 条 路 径 ( 直到 从 锁定 操作 中 返回 ) 也 是 快速 的 ， 可 以 把 递归 次 数 也 放 在 对 象 头 中 。 


为 了 实现 这 些 优化 ,现在 对 象 头 中 至 少 应 该 有 两 个 字 , 一 个 原来 用 于 vtable 的 槽 位 ， 男 一 个 
用 于 锁定 ， 这 就 是 “ 锁 字 ”( lock word )。 假设 VM 把 两 个 字 节 用 于 线程 ID， 一 个 字 节 用 于 递归 


次 数 ， 那 么 在 一 个 32 位 系统 中 的 对 象 头 布局 如 图 18-3 所 示 。 
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| 
图 18-3 支持 快速 monitor 锁定 的 对 象 头 布局 
两 字 节 线程 ID 可 以 容纳 最 多 64K 线程 ， 这 是 够 用 的 ， 有 时 候 甚 至 超过 了 一 个 平台 可 以 支持 
的 最 大 线程 数 。 一 字 节 递归 数字 允许 递归 锁定 一 个 对 象 128 次 ,这 可 能 也 是 够 用 的 。 出 于 安全 性 
考虑 ， 当 递归 数字 溢出 的 时 候 ， 需 要 一 个 备用 解决 方案 。 
使 用 这 个 新 布局 ， 不 需要 LOCK_BIT 来 锁定 对 象 ， 因 为 可 以 使 用 线程 ID 指示 锁定 状态 ， 如 
下 所 示 。 这 段 代 码 假定 字 为 小 端 架 构 。 


bool lock_non_blocking(Object* jmon) 
{ 






uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
Uint16 myID = current_thread()->tid; 
// 自动 交换 锁 字 中 的 线程 ID 
int oldID = CompareExchange(p_threadID, 0, myID); 
return (oldIp == Os 

} 


由 于 原子 指令 非常 昂贵 ， gee Paper ed HORE E ZH 4 BA A, 那么 会 
更 快 一 些 。 当 对 象 由 自身 锁定 时 ， 只 需 增加 一 个 递增 次 数 即 可 。 伪 代码 给 出 如 下 。 


bool lock_non_blocking_fast (Object* jmon) 
{ 
uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
uintl6 myID = (uint16) (current_thread()->tid); 
if( *pthreadID == myID) { 
// 被 自身 锁定 ， 增 加 递归 数 
uint8* p_recursion = (uint8*)lock_word_addr (jmon)+1; 
uint8 num_recursion = *p_recursion; 


// 如 果 递 归 数 溢出 ， 返 回 到 备用 解决 方案 
if( num_recursion == RECURSION_OVERFLOW ) 
*p_ recursion = ++num_recursion; 
if ( num_recursion < RECURSION_OVERFLOW ) 
return TRUE; 
else 
return FALSE; 
Jelse if( *pthreadID == 0 ){ 
// 空 闸 monitor， 自 动 交换 锁 字 的 线程 ID 
int oldID = CompareExchange(p_threadID, 0, newID); 
return (oldID == 0); 
} 
// 被 其 他 线程 锁定 ， 进 入 慢 路 径 
return FALSE; 
} 


递归 数 可 能 变 得 太 大 ， 以 至 于 无 法 放 在 锁 字 的 单个 字 节 中 。 这 种 情况 下 ， 需 要 一 个 备用 解决 
方案 , 它 可 以 简单 地 回 退 到 原来 的 慢 路 径 。 既 然 溢出 的 情况 是 少见 的 ， 这 不 会 对 快 路 径 的 性 能 有 


实际 影响 。 完 整 的 锁定 过 程 伪 代 码 如 下 所 示 。 
void STDCALL vm_object_lock (Object* 
{ 


jmon) 
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bool success = lock_non_blocking_fast (jmon); 


if( success ) return; 
// 对 象 或 者 被 其 他 线程 锁定 , 
// 或 者 递归 数 溢出 
uint16* p_threadID = 
Uint16 newID = 
if( *p_threadID == newID) { 

// 被 自身 锁定 ， 意 味 着 递归 数 溢出 

// 返回 到 locked_object_list 解决 方案 

Locked_obj* plock = null; 


(uint16) (current_thread() 


(uint16*) lock_word_addr (jmon) +1; 
->tid); 


Locked_obj* head = thread_get_locked_obj_list(); 


plock = lookup_in_locked_obj_list (head, 


if( plock->jobject == jmon) { 
// 已 经 在 列表 中 ， 那 么 增加 递归 数 


plock->recursion++; 


jelse{ 
// 第 一 次 溢出 ， 在 列表 中 创建 一 个 节 
plack = ge re obj* 


plock->jobject = jmon; 


jmon) ; 


)vm_ 和 


plock->recursion = MAX_FAST_RECURSION + 1; 


plock->next = head; 


thread_insert_locked_obj_list (plock) ; 





} 
}else{ 
// 被 其 他 线程 锁定 ， 在 这 个 monitor 上 休眠 
loek Blocking (jmon) ; 
// 从 休眠 中 返回 的 时 候 ， 持 有 这 个 锁 


// 这 是 第 一 次 锁定 jmon， 不 会 有 溢出 
} 
return; 
} 
用 于 锁定 的 VM 应 用 程序 接口 首先 调用 快速 路 径 。 


递归 数 溢出 或 者 锁 苑 争 的 情况 。 


18.2.2 ” 瘦 锁 解锁 路 径 
一 个 线程 解锁 它 锁 定 的 对 象 时 的 步骤 如 下 。 
口 步骤 1: 检查 自身 是 否 持 有 这 个 锁 。 


如 果 它 返回 FALSE, 就 走 慢 速 路 径 来 处 理 


口 步骤 2: 如 果 没 有 被 自身 锁定 ， 抛 出 IllegalMonitorstate 异常 并 返回 
O 步骤 3: 如 果 被 自身 锁定 ,检查 递归 数 。 如 果 弟 归 数 大 于 0， 递减 它 并 返回 。 


口 步骤 4: 如 果 递 归 数 为 0， 释 放 这 个 锁 ， 并 检查 是 否 有 任何 线程 在 阻 寨 等 竺 锁定 这 


如 果 没 有 等 待 线程 就 返回 。 
口 步骤 $: 如 果 有 等 竺 线程， 唤醒 它 并 返回 。 


图 18-4 展示 了 解锁 执行 流程 


文 个 对 象 ; 


o 箭头 宽 度 指 示 了 路 径 的 热度 。 
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图 18-4 解锁 一 个 monitor 的 操作 流程 


最 常见 的 路 径 是 步骤 4。 应 该 把 它 优 化 得 尽 可 能 快 。 其 他 路 径 的 优化 ， 比 如 步 又 3 和 步骤 5 
的 优化 是 可 选 的 。 步 又 2 通常 是 最 不 常见 的 路 径 。 

在 我 们 最 初 的 解锁 代码 实现 中 , 为 了 知道 是 否 有 线程 阻塞 等 待 一 个 被 释放 的 锁 ， 步 又 4 需要 
遍历 所 有 的 修改 器 。 这 显然 很 慢 。 从 步骤 1 到 步骤 4， 有 三 个 条 件 需 要 检查 : 锁 拥 有 者 、 递 归 数 
和 等 待 线程 。 目 前 ， 前 两 者 存储 在 锁 字 中 ,， 可 以 快速 检查 。 如 果 最 后 一 个 〈 即 是 否 有 等 符 线 程 这 
个 条 件 ) 也 可 以 通过 检查 锁 字 实现 ， 那 么 最 热 路 径 可 以 很 快 。 

出 于 这 个 目的 , 可 以 在 锁 字 中 放 入 一 个 标志 来 指示 是 否 有 任何 等 待 线程 。 我 们 称 之 为 苑 争 标 
志 。 可 以 使 用 锁 字 的 剩余 字 节 ( 最 低 字 节 ) 实现 它 。 那 么 解锁 代码 实现 如 下 所 示 。 


void STDCALL vm_object_unlock(Object* jmon) 
{ 


uintl6é* p_threadID = (uint16*) 1lock_word_addr (jmon) +1; 
uintl6 self = current_thread()->tid; 
if( *p_threadID == self) { 
// 被 自身 锁定 ， 检 查 递归 数 
uint8* p_recursion = (uint8*) lock_word_addr (jmon) +1; 
uint8* p_contention = (uint8*) lock_word_addr(jmon) ; 


if( *p_recursion ) { 
recursion_dec(jmon) ; 
} else{ 
*p threadID = 0; // AAH 
if( *p_contention ){ 
notify_blocking_threads (jmon) ; 
} 
} 
}else{ 
vm_throw_exception("IllegalMonitorState") ; 
} 
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这 里 有 一 个 潜在 的 竞 态 条 件 : 在 解锁 线程 检查 竞争 标志 的 同时 , 还 有 一 个 竞争 线程 正在 设置 
同一 个 标志 ( 即 因 该 锁 被 锁定 而 打算 阻塞 )。 为 了 确保 锁 拥 有 者 解锁 (因此 唤醒 休眠 线程 ) 时 永 
远 不 会 错过 竞争 标志 ， 线 程 之 间 需 要 实现 一 个 协议 

一 个 简单 协议 就 是 只 有 锁 的 拥有 者 可 以 设置 这 个 竞争 标志 -。 如 果 一 个 锁定 线程 发 现 这 个 锁 被 
其 他 线程 持 有 ， 并 且 竞 争 标志 没有 被 置 起 ， 那 么 它 不 会 休眠 等 待 ， 而 会 忙 等 (或 者 yield 等 待 )， 
然后 再 次 试图 锁定 。 它 只 有 在 看 到 竞争 标志 置 起 的 时 候 才 会 休 卢 等 待 。 一 旦 它 成 功 持 有 这 个 锁 ， 
就 会 设置 竞争 标志 。 在 这 个 协议 中 ， 竞 争 标志 可 以 是 单个 位 ， 不 需要 担心 访问 的 原子 性 。 

我 们 不 想 要 忙 等 (或 者 yield 等 待 )。 如果 竞争 线程 想 要 休眠 等 待 一 个 被 持 有 的 锁 ， 那 就 需要 
一 个 稍微 复杂 点 的 协议 来 保证 内 存 操作 顺序 。 

首先 ， 这 个 竞争 标志 需要 远离 其 他 锁 数 据 ， 这 样 设 置 /检查 它 就 不 会 影响 对 锁 字 其 他 字 节 的 
操作 。 换 句 话说 ,这 个 竞争 标志 的 设置 和 重 置 应 该 是 原子 化 和 独立 的 。 通 过 这 种 方式 ， 可 以 按照 
我 们 的 需求 来 设计 对 它们 的 访问 顺序 。 正 如 我 们 所 做 的 ， 锁 字 的 最 低 字 节 可 以 用 于 这 个 目的 。 

其 次 ,在 锁定 实现 中 ,在 竞争 线程 设置 竞争 标志 之 后 , 它 应 该 在 进入 休眠 之 前 再 试 一 下 非 阻 
塞 锁定 路 径 。 这 个 重 试 是 很 关键 的 ， 原 因 如 下 


O 如 果 在 重 试 中 ， 锁 还 没有 被 释放 ， 竞 争 线程 将 进入 休眠 等 待 中 。 锁 拥有 者 在 释放 锁 的 时 
候 能 够 看 到 竞争 标志 ， 因 为 它 在 释放 锁 “ 之 后 ”检查 竞争 标志 。 结 果 是 它 知 道 有 休眠 线 
程 并 会 唤醒 它 。 

口 如 果 在 重 试 中 锁 被 释放 ， 即 使 是 在 竞争 线程 设置 竞争 标志 之 后 ， 它 也 不 会 休眠 等 待 这 个 
锁 ， 所 以 它 不 需要 被 任何 人 唤醒 。 

在 使 用 宽松 内 存 一 致 性 (relaxed memory consistency ) 的 当代 微 处 理 吕 中， 由 于 非 阻塞 锁定 
操作 内 部 的 原子 比较 -交换 指令 ， 它 本 身 就 是 一 个 针对 所 有 内 存 读 写 操作 的 内 存 栅栏 (memory 
fence; 或 者 内 存 屏障 ，memory barrier )。 它 可 以 有 效 地 确立 竞争 标志 访问 和 线程 ID 访问 的 顺序 。 
锁定 的 伪 代 码 如 下 所 示 。 

void STDCALL vm_object_lock(Object* jmon) 

. bool result = lock_non_blocking_fast (jmon) ; 

if( result ) return; 


// 对 象 或 者 被 其 他 对 象 锁定 ， 
// 或 者 递归 数 溢出 


uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
uint16 myID = (uint16) (current_thread()->tid) ; 
if( *p_threadID == myID){ 


// 被 自身 锁定 ， 意 味 着 递归 数 溢出 


lock_recursion_overflow(jmon) ; 


jelse{ 
// 被 其 他 线程 锁定 ， 在 这 个 monitor EMR 
unit8* p_contention = (uint8*) lock_word_addr(jmon) ; 


*p contention = 1; 
result = lock_non_blocking fast (jmon) ; 
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if( result ) return; 
lock blocking (jmon); 


} 
通过 这 种 方式 ， 休 眼线 程 永远 不 会 错过 唤醒 。 


18.2.3 ”竞争 标志 重 置 支持 


不 管 使 用 什么 协议 , 在 目前 的 设计 中 都 不 能 重 置 竞争 标志 。 也 就 是 说 , 一 旦 竞争 标志 被 置 起 ， 
它 就 一 直 保 持 在 那里 ， 直 到 monitor 对 象 被 回收 。 因 为 锁 拥 有 者 总 是 需要 假定 有 竞争 ， 所 以 它 斌 
图 唤醒 的 可 能 是 实际 上 并 不 存在 的 等 待 线程 。 如 果 在 应 用 程序 的 整个 生存 期 只 有 少数 锁定 竞争 的 
话 ， 这 可 能 成 为 一 个 问题 。 


如 果 我 们 想 要 支持 苑 争 标志 重 置 , 就 需要 小 心安 排 多 个 线程 对 竞争 标志 的 访问 。 为 了 避免 复 
杂 的 设计 ,一 个 选择 是 使 用 常用 线程 同步 构件 来 控制 这 个 苑 争 标 志 , 比如 使 用 mutex 和 条 件 变 量 。 
当 一 个 苑 争 线程 被 阻塞 时 , 它 可 以 设置 苑 争 标 志 ， 并 在 这 个 条 件 变 量 上 等 待 。 当 锁 拥有 者 释放 这 
个 锁 的 时 候 , 它 会 重 置 这 个 标志 ,并 通知 所 有 等 待 线程 。 这 个 条 件 变 量 和 它 的 保护 mutex 被 放 入 
一 个 控制 数据 结构 中 。 第 一 次 需要 时 , 会 为 被 竞争 锁 创 建 出 这 个 控制 数据 结构 的 一 个 实例 。 那么 
新 的 伪 代 码 实现 如 下 所 示 。 


struct Control{ 
Mutex* mutex; 
Condvar* condvar; 
} 


void STDCALL vm_object_lock(Object* jmon) 
{ 
bool result = lock_non_blocking_fast (jmon); 
if( result ) return; 
// 对 象 或 者 被 其 他 线程 锁定 ， 
// 或 者 递归 数 溢出 
uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
VM_Thread* self = current_thread(); 
uintl6 myID = (uint16)self->tid; 
if( *p_threadID == myID) { 
// 被 自身 锁定 ， 意 味 着 递归 数 溢出 
recursion_overflow(jmon) ; 
}else{ 
// 被 其 他 线程 锁定 ， 在 这 个 monitor 上 休眠 
unit8* p_contention = (uint8*)lock word addr (jmon); 
Control* control = lookup_control (jmon); 
// 使 用 mutex 来 保护 这 个 条 件 变 量 
lock (control->mutex) ; 
while(true) { 
*p_ contention = 1; 
result = lock_non_blocking fast (jmon) ; 
if( result ) break; 
self->status = THREAD_STATE_MONITOR; 
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wait (control->condvar, control->mutex) ; 
self->status = THREAD_STATE_RUNNING; 
} 


unlock (control->mutex) ; 
} 


void STDCALL vm_object_unlock(Object* jmon) 
{ 


uintl6* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
uint16 self = (uint16) (current_thread()->tid); 
if( *p_threadID == self) { 
// 被 自身 锁定 ， 检 查 递归 数 
uint8* p_recursion = (uint8*) lock_word_addr (jmon) +1; 
uint8* p_contention = (uint16*) lock_word_addr (jmon) ; 


Ef *p_recursion ) { 
recursion_dec(jmon) ; 
}else{ 
*p_threadID = 0; // 释放 锁 
ift tp contention ){ 
Control* control = Lookup control (jmon) ; 
lock (control->mutex) ; 
cond_notify_all(control->condvar) ; 
*p contention = 0; 
unlock (control->mutex) ; 


} 
}else{ 
vm_throw_exception("IllegalMonitorState"); 
} 
} 
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程 。 如 果 有 多 个 竞争 线程 的 话 ， 在 它们 被 唤醒 之 后 ， 其 中 一 个 将 成 功 锁定 这 个 对 象 ， 其 余 的 则 会 
再 次 被 阻塞 。 它 们 会 再 次 设置 竞争 标志 。 竞 争 标志 最 终 只 会 被 最 后 一 个 竞争 线程 重 置 为 0。 当 它 
释放 锁 的 时 候 ， 最 后 一 个 竞争 线程 会 发 现 竞 争 标志 是 和 月 已 设置 的 ， 然 后 重 置 它 。 

尽管 只 有 一 个 线程 能 够 获得 锁 , 因为 竞争 标志 被 重 置 ,所 以 这 个 设计 需要 唤醒 所 有 等 竺 线程 。 
下 一 次 当 这 个 锁 被 释放 的 时 候 , 这 个 锁 的 拥有 者 不 会 试图 唤醒 任何 等 待 线程 ,除非 其 他 竞争 线程 
再 次 设置 了 这 个 标志 。 只 唤醒 一 个 线程 有 时 候 是 可 能 的 。 这 需要 只 在 没有 等 竺 线程 的 时 候 重 壮 这 
个 标志 。 AEWA, 我 们 通常 不 知道 一 个 条 件 变 量 上 等 待 线程 的 数量 ， 所 以 我 们 也 不 知道 什么 时 
候 重 置 这 个 标志 。 因 此 ， 我 们 必须 总 是 重 置 它 ， 从 而 唤醒 所 有 的 等 待 线程 。 

这 里 使 用 的 mutex 保护 了 竞争 标志 和 线程 等 待 状态 之 间 的 一 致 性 。 当 这 个 标志 未 被 置 起 的 时 
候 ， 一 定 没 有 等 待 线程 。 如 果 有 等 待 线程 ,那么 这 个 标志 一 定 被 置 起 。 同 时 ， 这 个 设计 仍然 保持 
了 和 以 前 一 样 的 顺序 性 : 如 果 这 个 标志 被 置 起 , 那么 解锁 线程 一 定 能 够 看 到 ， 因 为 这 个 标志 是 在 
它 试 验 非 阻塞 锁定 之 前 置 起 的 。 有 了 状态 一 致 性 和 操作 顺序 性 这 两 个 属性 ,这 个 设计 可 以 支持 竞 
争 标 志 重 置 。 
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既然 现在 对 竞争 标志 的 访问 由 mutex 保护 ， 它 不 需要 一 定 是 支持 原子 内 存 访问 的 单个 字 节 。 
只 要 不 影响 其 他 操作 ， 使 用 一 个 位 也 是 可 以 的 。 

上 面 的 优化 在 对 象 关 中 使 用 了 一 个 销 字 来 实现 锁定 和 解锁 的 常用 情况 , 它 可 以 被 称 为 “ 瘦 锁 ” 
( thin-lock )， 尽 管 与 Bacon 等 人 提出 的 最 初 设计 并 不 完全 相同 。Bacon 的 瘦 锁 自身 并 不 是 一 个 完 
整 的 monitor 解决 方案 ， 因 为 它 不 能 支持 对 竞争 锁 的 休 眼 等 待 、 递 归 数 溢出 和 object .wait ()- 


18.3 FES 


常用 路 径 优 化 通常 就 足够 好 了 , 但 有 时 候 非常 用 路 径 对 于 性 能 也 很 重要 。 有 些 应 用 程序 可 能 
有 大 量 锁 苑 争 或 递归 锁定 。 


比如 , 当 递 归 数 溢出 的 时 候 , 拥有 者 线程 需要 迭代 它 的 Locked_object_list 来 递增 /递减 
递归 数 。 当 有 锁 竞 争 的 时 候 ,， 解锁 线程 需要 迭代 全 局 修改 顺 列 表 来 唤醒 阻塞 线程 ,或 者 使 用 一 个 
额外 的 控制 数据 结构 来 支持 苑 争 重 置 。 


18.3.1 & monitor 数据 结构 


为 了 简化 设计 ， 可 以 创建 一 个 简单 的 monitor 数据 结构 与 锁 对 象 相关 联 ， 并 包含 其 操作 所 需 
的 所 有 信息 。 例 如 , 这 个 数据 结构 可 以 包含 递归 数 和 在 这 个 锁 上 阻塞 的 线程 。 它 可 能 看 起 来 如 下 
所 示 。 


struct VM_Monitor{ 
VM_Thread* owner; 
int recursion; 
// 在 锁定 这 个 monitor 上 阻塞 的 线程 ， 替 代 blocked_lock 
Thread_List* blocked_list; 
// 在 这 个 monitor 上 等 待 的 线程 ， 替 代 waited_condition 
Thread_List* waited_list; 
} 
这 个 数据 结构 在 一 个 位 置 整合 了 monitor 的 所 有 相关 信息 。 我 们 最 初 的 实现 把 这 些 信息 分 散 
在 所 有 涉及 的 线程 中 。 
为 了 把 这 样 一 个 数据 结构 与 锁 对 象 相 关联 ， 类 似 于 GC 设计 中 的 “转发 指针 ”， 这 里 需要 一 
个 映射 表 。 它 可 以 在 对 象 头 的 锁 字 中 使 用 一 个 指针 ， 或 者 使 用 一 个 堆 外 目标 映射 表 。 
首先 我 们 讨论 “指针 ”解决 方案 ， 即 在 对 象 头 的 锁 字 中 安装 一 个 指向 它 关 联 的 monitor 数据 
结构 的 指针 。 在 实际 实现 中 , 可 以 在 锁 字 中 使 用 一 个 monitorID ， 只 要 能 用 它 高 效 地 找到 monitor 
数据 结构 就 可 以 。 
所 有 的 monitor 操作 都 可 以 在 这 个 monitor 数据 结构 上 执行 。 比 如 : 


void STDCALL vm_object_lock(Object* jmon) 
{ 


VM_Monitor* mon = monitor_pointer(jmon) ; 
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VM Thread* self = current_thread() ; 


if( mon->owner == NULL) { 
int oldID = CompareExchange(&mon->owner, NULL, self); 
ift oldID == NUL J return; 
}else if ( mon->owner == self ){ 
// 被 自身 锁定 
mon->recursion++; 
return; 
} 


// 被 其 他 线程 锁定 

insert_self_in_list (mon-sblocked_list); 
lock_blocking (mon) ; 

delete_self_in_list (mon->blocked_list); 
mon->owner = current_thread(); 


} 


void STDCALL vm_object_unlock(Object* jmon) 
{ 


VM_Monitor* mon = monitor_pointer(jmon) ; 


if( mon->owner == current_thread() ) { 
// 被 自身 锁定 
if( mon->recursion ){ 
mon->recursion --; 
jelse{ 
mon->owner == NULL; 
notify_blocking_threads (mon) ; 
} 
jelse{ // 锁 被 其 他 线程 持 有 
vm_thread_exception("IllegalMonitorState"); 


} 


这 样 维护 起 来 要 简单 得 多 ， 代 价 是 对 象 关 中 的 一 个 指针 。 


注意 ， 这 个 设计 中 没有 竞争 标志 。 释 放 锁 的 线程 总 要 检查 blockeq_list 来 唤醒 任何 等 待 
线程 。 


18.3.2 ZA OS 来 支持 


正如 前 面 所 讨论 过 的 ，monitor 的 语义 由 用 于 锁定 /解锁 的 mutex， 以 及 用 于 等 待 /通知 的 条 件 
变量 组 成 (之 前 的 代码 只 展示 了 mutex 部 分 )。 直接 使 用 底层 OS 的 mutex 和 条 件 变 量 支 持 , 实现 
起 来 更 简单 。 有 些 OS 甚至 提供 了 原生 monitor 支持 。 这 样 VM 就 不 需要 维护 阻塞 线程 列表 和 信 
号 这 些 东 西 了 。 实际 上 实现 正确 高 效 的 线程 同步 原 语 是 很 困难 的 , 特别 是 在 宽松 内 存 一 致 性 的 多 
核 平台 上 。 


对 于 一 个 有 mutex 和 条 件 变量 支持 的 平台 ，VM 可 以 定义 如 下 monitor 数据 结构 。 


struct VM_Monitor{ 
VM_Thread* owner; 
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int recursion; 
Mutex* mutex; 
Condvar* condvar; 


新 的 锁定 代码 可 以 实现 如 下 。 
void STDCALL vm_object_lock(Object* jmon) 
{ 


VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_lock (mon); 


void STDCALL vm_object_unlock(Object* jmon) 
{ 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_unlock (mon); 


void monitor_lock(VM_Monitor* mon) 
{ 


if( mon->owner == current_thread() ) { 
// 被 自身 锁定 
mon->recursion++; 

}else{ 


mutex lock(mon->mutex); 
mon->owner = current_thread(); 


void monitor_unlock(VM_Monitor* mon) 
{ 
if( mon->owner == current_thread() ) { 
// 被 自身 锁定 
if( mon->recursion ) { 
mon->recursion --; 
yelse{ 
mon->owner == NULL; 
mutex_unlock (mon->mutex) ; 
} 
Jelse{ // 锁 由 其 他 线程 持 有 


vm_thread_exception("IllegalMonitorState") ) ; 
} 
Object .wait ()/notify () 的 伪 码 可 以 实现 如 下 。 


void STDCALL vm_object_wait (Object* jmon, unsigned int ms) 
{ 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_wait (mon) ; 


void STDCALL vm_object_notify (Object* jmon) 
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VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_notify (mon) ; 
} 


void monitor_wait (VM_Monitor* mon, unsigned int ms) 
{ 
VM Thread* self = current_thread(); 


if( mon->owner != self ) { 
vm_throw_exception("IllegalMonitorState") ; 
return; 


} 
self->status= THREAD_STATE_WAIT; 
// 使 用 OS 的 条 件 定时 等 待 支持 


int temp_recursion = mon->recursion; 

mon->recursion = 0; 

bool signaled = cond timed wait (mon->condvar, mon->mutex, ms); 
// 唤醒 

self->status= THREAD_STATE_RUNNING; 

mon->recursion = temp_recursion; 


false; 
"Interrupted") ; 


if (self->interrupted) { 
self->interrupted = 
vm_throw_exception ( 

} 


void monitor_notify (VM_Monitor* mon) 
{ 


if( mon->owner != current_thread() ) { 
vm_throw_exception("IllegalMonitorState") ; 
return; 


} 
// 使 用 OS 的 通知 支持 


cond_notify(mon->condvar) ; 


这 个 使 用 monitor 数据 结构 的 实现 很 简单 地 支持 了 所 有 情况 ， 包 括 像 递 归 数 溢出 、 线 程 阻 塞 
等 边界 情况 。 瘦 锁 对 此 并 没有 很 好 的 支持 。 它 并 没有 用 竞争 标志 告诉 锁 拥 有 者 是 否 有 休眠 等 待 线 
程 ， 因 为 mutex 默认 就 有 了 这 个 支持 。 解 锁 一 个 mutex 就 自动 唤醒 在 其 上 等 待 的 线程 。 


这 个 实现 在 性 能 和 空间 方面 都 有 开销 ,与 瘦 锁 相 比 , 这 个 实现 的 性 能 代价 是 总 要 访问 monitor 
数据 结构 以 进行 monitor 操作 ， ee ee 空间 代价 是 每 个 monitor 都 有 的 额 
外 数据 结构 。 出 于 这 个 原因 ， 这 个 设计 有 时 候 也 被 称 为 “ 胖 锁 ”( fat-lock )。 


18.3.3 JESHI AKA BES 


GR SPAT DASE LE AS ULB te ee a, CER e FEE, 那 就 是 我 们 想 要 的 。 
个 对 象 可 以 从 瘦 锁 开始 ， 只 在 它 的 操作 涉及 递归 数 流出 和 线程 阻塞 ( 由 于 因 锁 定 阻 塞 或 者 
Object.wait() ) 的 时 候 变 为 胖 锁 。 社 区 中 称 这 个 过 程 为 “膨胀 ”( inflation )。 
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膨胀 设计 可 以 使 用 一 个 膨胀 标志 ,类 似 于 前 面 讨 论 过 的 竞争 标志 。 当 膨胀 发 生 ( 由 于 递归 数 
淤 出 或 者 锁 殉 争 ) 的 时 候 ， 锁 字 由 瘦 锁 数据 变 为 一 个 指向 monitor 数据 结构 ( 胖 锁 ) 的 指针 ， 同 
时 脱 胀 标志 被 置 起 。 

膨胀 函数 在 胖 锁 中 需要 重新 生成 瘦 锁 的 当前 状态 , 方法 是 再 次 锁定 胖 锁 ,次数 与 瘦 锁 被 锁定 
次 数 相同 ， 如 下 所 示 。 

void lock_inflate(Object* jmon) 


{ 


uint8 recursion = *((uint8*) lock_word_addr(jmon) +1); 


VM_Monitor* mon = vm_alloc(sizeof (VM_Monitor) ); 
mon->mutex = new_recursive_mutex(); 
mon->condvar = new_condvar(); 
// 瘦 锁 已 经 被 锁定 了 recursion+l1 次 
mon->owner = current_thread(); 
mon->recursion = recursion; 
monitor_pointer_set(jmon, mon); 

} 


PAPA WA AK ARS BT SZ CEI HA Be PREZ) ESA EAS RE, A ETE AS AR 
件 ， 需 要 一 个 线程 之 间 的 协议 。 
一 个 简单 协议 是 只 允许 锁 的 拥有 者 膨胀 这 个 锁 , 而 且 脱 胀 的 锁 永 远 不 会 收缩 ,类似 于 不 支持 
重 曾 的 欧 争 标志 的 最 初 设计 。 这 里 设置 苑 争 标志 的 操作 替换 为 膨胀 瘦 锁 。 也 就 是 说 , 瘦 锁 的 拥有 
者 在 通过 竞争 取得 瘦 锁 之 后 膨胀 它 。 同 时 ， 其 他 竞争 线程 忙 等 (或 yield 等 待 ) 锁 从 瘦 锁 转化 为 
胖 锁 。 因 为 竞争 线程 依赖 于 monitor 数据 结构 来 休眠 ， 所 以 它们 在 膨胀 完成 之 前 无 法 休眠 等待 
这 个 设计 没有 使 用 竞争 标志 来 告诉 锁 拥 有 者 是 否 有 等 待 线程 。 当 瘦 锁 被 竞争 的 时 候 , 竞争 线 
程 只 能 忙 等 。 当 一 个 锁 被 膨胀 后 ， 这 个 胖 锁 会 负责 苋 争 管理 。 
当 一 个 锁 被 它 的 拥有 者 膨胀 的 时 候 , 另外 一 个 线程 可 能 正在 竞争 这 个 锁 。 竞 争 线程 可 能 在 锁 
被 膨胀 之 前 看 到 一 个 瘦 锁 ,那么 这 个 竞争 线程 仍 会 使 用 瘦 锁 算法 来 锁定 它 。 也 就 是 说 , 在 看 到 一 
个 瘦 锁 和 锁定 它 这 两 次 操作 之 间 , 这 个 锁 可 能 变 成 了 胖 锁 。 这 个 设计 应 该 确保 锁定 瘦 锁 的 操作 在 
胖 锁 上 会 失败 。 一 个 解决 方案 是 把 两 字 节 的 线程 ID 限制 为 15 位 ， 把 最 高 位 留 作 膨 胀 标志 。 如 果 
膨胀 标志 被 设置 ， 那 么 这 两 个 字 节 会 一 起 构成 一 个 不 同 于 任何 线程 ID 的 数字 。 瘦 锁 算 法 仍然 把 
这 两 个 字 节 一 起 看 作 线 程 标志 。 当 一 个 线程 试图 用 瘦 锁 算法 锁定 一 个 被 脱 胀 的 锁 时 , 它 会 认为 锁 
被 其 他 线程 锁定 了 ， 因 此 总 会 失败 。 
带 膨 胀 支持 的 锁 伪 代码 实现 如 下 
void STDCALL vm_object_lock(Object* jmon) 
{ 
// 首先 用 瘦 锁 非 阻塞 锁定 试验 
bool success = lock_non_blocking_fast (jmon) ; 
if( success ) return; 


// 对 象 可 能 (1) 被 其 他 线程 锁定 、 
// (2) 递 归 数 溢出 ， 或 者 (3 ) EAR 
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uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
uintl6 newID = (uint16) (current_thread()->tid); 
if( *p_threadID == newID) // 递归 数 溢 出 ， 膨 胀 它 
lock_inflate(jmon); // 不 返回 ， 在 下 面 锁 定 它 
// 被 其 他 线程 锁定 
while( !lock_is_fat(jmon) ) { 
// 可 能 被 其 他 线程 取得 并 膨胀 
yield(); 
success = lock_non_blocking_fast (jmon) ; 
if( success ){ 
lock_inflate(jmon) ; 
return; 


} 

// BEAR 

VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_lock(mon) ; 

return; 


~ 


void STDCALL vm_object_unlock(Object* jmon) 
{ 
if( !lock_is_fat(jmon) ){ 
object_unlock_thin(jmon) ; 
}else{ // HER 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_unlock(mon) ; 


void STDCALL vm_object_wait (Object* jmon, unsigned int ms) 
{ 
if( !lock_is_fat(jmon) ){ 
lock_check_state(jmon) ; 
lock_inflate(jmon) ; 
} 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_wait(mon, ms); 


void STDCALL vm_object_notify(Object* jmon) 
if( !lock_is_fat(jmon) ){ // Ri 
lock_check_state(jmon) ; 
// 瘦 锁 没有 任何 锁 上 等 待 线程 
return; 
} 


VM_Monitor* mon = monitor_pointer (jmon); 


monitor_notify (mon) ; 
| 18 


注意 monitor 数据 结构 是 在 VM 中 分 配 的 , 它 的 地 址 和 对 象 关中 的 vtable 指针 一 样 是 固定 的 。 
垃圾 回收 不 会 移动 它 。 和 否则 对 象 锁 字 中 的 指针 也 需要 像 对 象 引 用 一 样 被 更 新 。 
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18.3.4 休眠 等 待 被 竞争 瘦 锁 
上 上面 的 设计 有 两 个 很 容易 发 现 的 缺点 。 第 一 个 缺点 是 , 在 锁 被 膨胀 之 前 , 在 瘦 锁 上 的 竞争 线 
Pein 2 yield 等 待 这 个 锁 ， 而 不 是 休眠 等 待 。 第 二 个 缺点 是 ， 一 旦 锁 被 膨胀 ， 就 无 法 被 收缩 。 
第 一 个 问题 无 伤 大 雅 ， 特 别 是 当 锁 生命 期 比较 短 的 时 候 。 如 果 它 变 得 很 严重 的 话 ， 可 以 再 次 
使 用 竞争 标志 的 设计 来 解决 这 个 问题 。 这 个 设计 允许 竞争 线程 设置 竞争 标志 ,然后 在 控制 数据 结 
构 上 休眠 。 与 前 面 的 设计 相 比 ， 关 于 竞争 标志 重 置 的 主要 变化 如 下 。 
口 何 时 重 置 竞争 标志 : 竞争 标志 是 为 了 指示 对 瘦 锁 的 竞争 。 一 旦 这 个 锁 被 膨胀 ， 竞 争 标 志 
就 没有 用 了 ， 因 为 胖 锁 不 需要 它 。 出 于 这 个 原因 ， 竞 争 标志 在 锁 脱 胀 过 程 中 被 重 置 ， 而 
不 是 像 在 前 面 的 设计 中 那样 ， 在 解锁 过 程 中 被 重 置 。 
一 个 瘦 锁 的 解锁 线程 只 检查 竞争 标志 是 和 否 被 设置 ， 以 唤醒 这 个 控制 数据 结构 上 的 等 待 
线程 . 
口 唤醒 多 少 个 线程 : 当 一 个 首 锁 的 拥有 者 释放 这 个 锁 的 时 候 ， 如 果 竞 争 标志 被 置 起 ， 它 需 
要 唤醒 一 个 等 待 这 个 控制 数据 结构 的 竞争 线程 。 被 唤醒 的 线程 可 能 获取 这 个 锁 并 膨胀 它 。 
像 之 前 的 设计 那样 唤醒 所 有 等 待 线程 没有 什么 意义 ， 因 为 被 唤醒 线程 中 能 够 赢得 竞争 的 
不 会 超过 一 个 。 甚 至 可 能 有 新 创建 线程 在 所 有 被 唤醒 线程 之 前 获得 锁 。 
未 被 唤醒 的 线程 会 继续 在 这 个 控制 数据 结构 上 等 待 ， 直 到 一 个 苑 争 者 态 得 锁 并 把 它 膨胀 
为 胖 锁 ,然后 它们 会 继续 在 这 个 胖 锁 上 休眠 。 
在 之 前 的 设计 中 ， 所 有 的 等 待 线程 都 被 唤醒 ， 因 为 这 时 竞争 标志 被 重 置 。 在 当前 的 设计 
中 ， 这 是 在 膨胀 过 程 中 完成 的 。 
D 竞争 线程 在 什么 上 休 卢 : 当 竞 争 线程 等 待 一 个 瘦 锁 的 时 候 ， 它 们 在 与 这 个 竞争 标志 管理 
关联 的 控制 数据 结构 上 休眠 。 
当 竞争 标志 被 重 置 ， 并 且 锁 被 膨胀 的 时 候 ， 这 个 控制 数据 结构 上 的 所 有 等 待 线程 都 会 被 
唤醒 ,以 重新 请 求 这 个 锁 。 如 果 其 中 任何 一 个 获取 失败 ， 那么 它们 就 会 在 这 个 胖 锁 上 休 
眼 等 待 ， 而 不 是 在 这 个 控制 数据 结构 上 。 
在 之 前 的 设计 中 ， 因 为 没有 胖 锁 ， 所 以 控制 数据 结构 是 唯一 休眠 的 地 方 。 
既然 锁 膨 胀 动作 包含 重 置 竞争 标志 和 通知 条 件 变 量 上 的 休眠 线程 这 些 动作 , 那么 为 了 保持 一 
致 性 , 这 个 动作 需要 用 控制 数据 结构 的 mutex 来 保护 。 前 面 没 有 竞争 标志 的 膨胀 算法 不 需要 这 个 
保护 。 
膨胀 可 能 发 生 在 三 个 位 置 : 递归 数 溢出 、 一 个 竞争 线程 获得 锁 ， 以 及 一 个 锁 拥 有 者 在 这 个 对 
象 上 调用 Object .wait ()。 所 有 这 些 都 应 该 被 mutex 保护 。 
下 面 的 伪 代 码 给 出 不 用 线程 忙 等 的 锁 脱 胀 设计 。 
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void STDCALL vm_object_lock(Object* jmon) 


{ 


// 首先 试验 瘦 锁 非 阻塞 锁 定 
bool result = lock_non_blocking_fast (jmon) ; 
if( result ) return; 
// 对 象 可 能 (1) 被 其 他 线程 锁定 、 
// (2) 递 归 数 溢出 ， 或 者 (3) 变 为 胖 锁 
uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
VM_Thread* self = current_thread(); 
uintl6 newID = (uint16)self->tid; 
if( *p_threadID == newID){ // 递归 数 溢出 ， 膨 胀 它 
Control* control = lookup_control(jmon) ; 
mutex_lock(control->mutex) ; 
lock_inflate(jmon) ; 
mutex_unlock(control->mutex) ; 
} 
// RRR 
if( lock_is_fat(jmon) ){ 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_lock(mon) ; 
return; 
} 
// 首 锁 ， 但 是 被 其 他 线程 锁定 ， 等 待 
Control* control = lookup_control(jmon) ; 
mutex_lock(control->mutex) ; 
while( !lock_is_fat(jmon) ) { 
*p contention = 1; 
result = lock_non_blocking_fast (jmon) ; 
if( result ){ 
lock_inflate(jmon) ; 
mutex_unlock(control->mutex) ; 
return; 
} 
self->status = THREAD _STATE_MONITOR; 
cond_wait(control->condvar, control->mutex) ; 
self->status = THREAD _STATE_RUNNING; 
} 
mutex_unlock(control->mutex) ; 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_lock (mon); 
return; 


void lock_inflate(Object* jmon) 


{ 


uint8 recursion = *((uint8*) lock_word_addr (jmon) +1) ; 


VM_Monitor* mon = vm_alloc(sizeof (VM_Monitor) ); 
mon->mutex = new_recursive_mutex(); 
mon->condvar = new_condvar(); 

mon->owner = current_thread(); 

mon->recursion = recursion; 
monitor_pointer_set(jmon, mon); 
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Control* control = lookup_control(jmon) ; 
*p contention = 0; 
cond_notify_all(control->condvar) ; 


void STDCALL vm_object_unlock(Object* jmon) 
{ 
if( !lock_is_fat(jmon) ){ // A% 
lock_check_state(jmon) ; 


uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
// 被 自身 锁定 ， 检 查 递归 数 

uint8* p_recursion = (uint8*) lock_word_addr (jmon) +1; 
uint8* p_contention = (uint16*) lock_word_addr(jmon) ; 


TE( *pcrécursion ){ 
recursion_dec(jmon) ; 
jelse{ 
*p_threadID = 0; // 释放 锁 
if( *p_contention ){ 
Control* control = lookup_control(jmon) ; 
mutex _lock(control->mutex) ; 
cond_notify(control->condvar) ; 
mutex _unlock(control->mutex) ; 


} 

Jelse{ // WF% 
VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_unlock (mon); 


void STDCALL vm_object_wait(Object* jmon, unsigned int ms) 


{ 


if( !lock_is_fat(jmon) ){ 
lock_check_state(jmon) ; 
Control* control = lookup_control(jmon) ; 


mutex_lock(control->mutex) ; 

lock_inflate(jmon) ; 

mutex_unlock(control->mutex) ; 
} 


VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_wait (mon, ms); 


void STDCALL vm_object_notify(Object* jmon) 
{ 


if( !lock_is_fat(jmon) ){ 
lock_check_state(jmon) ; 
return; 


} 
VM_Monitor* mon = monitor_pointer(jmon) ; 


monitor_notify (mon) ; 
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这 个 设计 的 关键 点 是 , 它 为 每 个 锁 对 象 使 用 了 一 个 控制 数据 结构 ,以 允许 竞争 线程 在 其 上 休 
眠 。 当 这 个 锁 被 膨胀 为 胖 锁 之 后 ， 就 停止 使 用 这 个 数据 结构 ， 竞 争 线程 移动 到 翌 锁 上 阻塞 。 

为 保证 正确 性 , 这 个 设计 主要 确保 了 两 点 。 第 一 点 是 , 当 一 个 线程 在 一 个 瘦 锁 上 休眠 的 时 候 ， 
它 不 应 该 错过 唤醒 。 第 二 点 是 ， 当 一 个 锁 变 为 胖 锁 之 后 ， 所 有 休眠 线程 都 被 移动 到 胖 锁 上 。 

尽管 在 上 述 两 种 情况 下 ， 线 程 都 是 阻塞 休眠 ， 但 这 些 线程 在 不 同位 置 上 以 不 同 的 方式 休眠 。 
在 瘦 锁 中 ,它们 在 控制 数据 结构 上 休眠 ,等 待 条 件 变 量 , 条 件 变 量 可 以 被 男 一 个 线程 通过 通知 来 
唤醒 。 在 胖 锁 中 ,它们 在 monitor 数据 结构 上 休眠 ， 阻 蹇 于 这 个 monitor 的 mutex E, mutex 可 以 
被 其 他 线程 通过 解锁 来 唤醒 。 这 个 区 别 对 接 下 来 将 要 介绍 的 设计 有 重要 的 影响 。 

膨胀 动作 总 是 被 mutex 保护 ， 所 以 直接 把 mutex 锁定 /解锁 操作 放 和 人 膨胀 冰 数 中 也 可 以 。 而 那 
样 的 话 ， 我 们 就 需要 添加 一 个 mutex 解锁 ,在 竞争 线程 成 功 赢得 瘦 锁 之 后 和 膨胀 之 前 ， 代 码 如 下 : 


result = lock_non_blocking_fast (jmon) ; 
if( result ){ 
mutex_unlock(control->mutex) ; 
lock_inflate(jmon) ; 
return; 


} 

这 一 节 中 的 设计 允许 瘦 锁 上 的 竞争 线程 在 一 个 控制 数据 结构 上 休眠 等 待 。 它 不 支持 收缩 。 要 
添加 收缩 支持 相对 来 说 也 比较 简单 。 需 要 做 的 就 是 检查 是 否 没有 线程 阻塞 或 等 待 在 这 个 胖 锁 上 ，， 
然后 把 锁 字 变 回首 锁 。 
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允许 阻塞 线程 休眠 等 待 的 设计 依赖 于 控制 数据 结构 。 我 们 观察 到 一 点 , 那 就 是 这 个 控制 数据 
结构 实际 上 实现 了 一 个 非 递归 monitor, 可 以 用 一 个 monitor 数 据 结构 代替 这 个 控制 数据 结构 。 我 
们 实际 上 可 以 把 胖 锁 实 现 重 用 于 这 个 控制 数据 结构 。 

我 们 还 观察 到 ,设计 中 这 个 控制 数据 结构 只 在 瘦 锁 膨胀 为 胖 锁 之 前 使 用 。 换 句 话 说 ,这 个 控 
制 数据 结构 的 使 用 和 monitor 数据 结构 的 使 用 时 段 是 没有 交 欠 的 。 如 果 我 们 想 要 把 控制 数据 结构 
替换 为 一 个 monitor 数据 结构 ， 直 接 使 用 这 个 锁 对 象 的 同一 个 monitor 数据 结构 就 很 方便 。 


18.4.1 将 同一 个 胖 锁 monitor 用 于 竞争 控制 

如 果 要 把 同一 个 monitor 数据 结构 用 于 竞争 控制 和 胖 锁 的 话 ， 在 设计 中 有 如 下 几 处 修改 。 

1. 访问 monitor 

在 之 前 的 设计 中 , 用 于 竞争 标志 的 控制 数据 结构 通过 一 个 全 局 映射 表 访问 , 它 把 一 个 对 象 地 
址 映射 到 控制 数据 结构 。 胖 锁 的 monitor 数据 结构 通过 锁 字 访问 。 现 在 如 果 我 们 使 用 同一 个 数据 
结构 ， 两 条 路 径 我 们 应 该 都 支持 ， 这 样 不 管 是 瘦 锁 还 是 胖 锁 都 可 以 一 直 访问 到 monitor 数据 ， 如 
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下 所 示 。 


VM_Monitor* lookup_monitor(Object* jmon) 
{ 
if( lock_is_fat(jmon) ) 
return monitor_pointer (jmon) ; 
else 
return lookup_control (jmon) ; 


} 


第 一 次 为 一 个 对 象 调 用 Lookup_cont rol (jmon) 的 时 候 创 建 这 个 对 象 的 monitor 数据 结构 。 
当 瘦 锁 上 有 竞争 的 时 候 ， 它 的 递归 数 溢出 的 时 候 ， 或 者 在 这 个 锁 对 象 上 调用 Object .wait () É 
时 候 ， 这 就 会 发 生 。 

2. 膨胀 过 程 

在 前 面 的 设计 中 ， 脱 胀 函数 在 monitor 中 重新 生成 这 个 瘦 锁 的 状态 ,方法 是 以 瘦 锁 被 锁定 次 
数 的 相同 次 数 锁定 monitor。 脱 胀 操作 被 一 个 控制 数据 结构 的 mutex 保护 ， 现 在 这 个 数据 结构 被 
替换 为 monitors 

这 意味 着 ， 在 当前 设计 中 ， 在 膨胀 被 调用 之 前 ， 为 了 保护 这 个 膨胀 过 程 ， 这 个 monitor 已 经 
被 锁定 了 一 次 。 因 此 ， 当 膨胀 函数 在 monitor 中 重新 生成 锁 状 态 的 时 候 ， 它 不 会 再 次 设置 锁 拥 有 
者 ， 而 会 设置 递归 数 。 

另外 , 在 前 面 的 设计 中 ,monitor 数据 结构 是 在 膨胀 过 程 中 创建 的 。 既 然 这 个 monitor 在 瘦 锁 
竞争 管理 和 膨胀 保护 中 会 被 使 用 ， 那 么 这 个 monitor 数据 结构 需要 在 膨胀 之 前 就 存在 。 膨 胀 函数 
不 需要 创建 一 个 数据 结构 ， 而 是 把 monitor 数据 结构 作为 一 个 参数 传 给 它 。 伪 代码 给 出 如 下 。 


void lock_inflate(Object* jmon, VM_Monitor* mon) 
{ 


uint8 recursion = *((uint8*) lock_word_addr (jmon) +1) ; 
// 重新 生成 锁定 状态 为 recursion + 1k 
mon->recursion = recursion; 


monitor_pointer_set(jmon, mon); 
*p_contention = 0; 
monitor_notify_all (mon) ; 


} 

3. 膨胀 过 程 中 monitor 的 双重 角色 

锁 脱 胀 只 能 被 持 有 这 个 锁 的 线程 执行 。 拥 有 者 把 瘦 锁 切换 为 胖 锁 。 在 前 面 的 设计 中 ,用 控制 
数据 结构 的 一 个 mutex 保护 膨胀 过 程 ， 在 膨胀 结束 之 后 应 该 解锁 这 个 mutex。 现 在 ， 既 然 这 个 控 
制 数 据 结构 被 蔡 换 为 瘦 锁 膨胀 后 的 同一 个 monitor， 拥 有 者 应 该 继续 拥有 它 ， 而 不 是 在 膨胀 之 后 
解锁 它 。 

这 意味 着 ， 对 于 膨胀 过 程 来 说 ，monitor 现在 有 两 个 角色 。 一 个 是 用 于 保护 膨胀 过 程 ， 另 一 
个 是 作为 新 拥有 的 锁 。 在 膨胀 之 后 ,， 它 保护 膨胀 过 程 的 角色 就 结束 了 , 但 它 作为 被 拥有 的 锁 的 角 
色 还 在 继续 ， 因 此 在 膨胀 之 后 不 需要 解锁 它 。 
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4. TẸ monitor 锁定 /解锁 对 


在 前 面 的 设计 中 ,如果 有 锁定 竞争 者 的 话 ， e PRET EE PE Tl TAT, SA Re P 
标志 ,并 重 试 去 锁定 这 个 瘦 锁 ( 如 果 它 仍然 是 瘦 锁 的 话 )。 控制 数据 结构 的 锁 和 瘦 锁 是 不 同 的 锁 。 


现在 通过 用 monitor 替换 控制 数据 结构 ， 竞 争 线程 在 置 起 竞争 标志 并 重 试 瘦 锁 之 前 ， 首 先 需 
要 锁定 这 个 monitor。 同 时 锁定 同一 个 对 象 的 monitor 和 瘦 锁 ， 这 看 起 来 是 有 问题 的 。 但 实际 上 这 
没有 问题 ， 因 为 此 刻 ( 这 时 这 个 对 象 是 一 个 瘦 锁 ) 这 个 monitor 的 角色 只 是 一 个 保护 性 控制 数据 
机 构 ， 而 不 是 这 个 对 象 真正 的 monitor。 


而 如 果 锁 被 膨胀 了 ， 它 的 角色 就 是 真正 的 monitor。 下 面 的 场景 是 可 能 存在 的 : 一 个 瘦 锁 的 
苑 争 线程 请 求 这 个 monitor ( 作为 控制 数据 结构 ) 并 在 其 上 休眠 。 当 它 被 唤醒 的 时 候 ， 它 用 来 休 
眠 的 这 个 monitor 已 经 变 成 了 胖 锁 monitor (不 再 是 控制 数据 结构 )。 这 种 情况 下 ， 当 它 醒 来 的 时 
候 ， 这 个 线程 不 需要 解锁 这 个 控制 数据 结构 并 锁定 胖 锁 monitor， 因 为 醒 来 的 过 程 中 已 经 取得 了 
这 个 胖 锁 。 可 以 移 除 这 一 对 控制 解锁 和 monitor 锁定 的 动作 。 


从 男 一 个 角度 看 ， 如 果 中 间 没 有 代码 的 话 ， 那 么 任何 一 对 胖 锁 锁定 /解锁 动作 都 可 以 被 移 除 。 
锁定 /解锁 对 可 能 存在 是 因为 在 前 面 的 设计 中 ， 锁 定 /解锁 是 在 不 同 的 数据 结构 上 进行 的 ， 即 一 个 
是 在 控制 数据 结构 上 ， 男 一 个 是 在 monitor 数 据 结构 上 。 现 在 二 者 使 用 同一 个 数据 结构 ， 因 此 它 
们 变 成 了 一 对 元 余 操 作 。 


5. monitor 和 控制 合并 的 实现 
下 面 是 把 同一 个 胖 锁 monitor 用 作 并 发 控制 的 伪 代 码 。 这 是 基于 前 面 设 计 的 一 个 标注 修改 版 。 


void STDCALL vm_object_lock(Object* jmon) 
{ 
// 首先 用 瘦 锁 非 阻塞 锁定 试验 
bool result = lock_non_blocking_fast (jmon) ; 
if( result ) return; 
// 对 象 可 能 (1) 被 其 他 线程 锁定 、 
// (2) 递 归 数 溢出 ， 或 者 (3) EAM 
uint1l6* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
VM_Thread* self = current_thread(); 
if( *p_threadID == newID){ // 递归 数 溢 出 ， 膨 胀 它 
VM_Monitor* mon = lookup_monitor(jmon) ; 
monitor_lock(mon) ; 
lock_inflate(jmon) ; 
// 膨胀 后 移 除 
montter_untieeltmen} 
return; 
} 
// 胖 锁 。 这 个 逻辑 合并 到 下 面 的 代码 中 


// 胖 锁 或 者 将 要 成 为 胖 锁 
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VM_Monitor* mon = lookup_monitor(jmon) ; 
monitor_lock(mon) ; 


while( !lock_is_fat(jmon) ) { 
*p_ contention = 1; 
result = lock_non_blocking_fast (jmon) ; 
if( result ){ 
lock_inflate(jmon, mon) ; 
// 膨胀 后 移 除 
momie oeme 
return; 
} 
monitor_wait (mon); 
} 
// TRAR / BT 
mentors Sek tent 
a ， i P ‘ A ; 
rmeniter_teektrent 


return; 


void STDCALL vm_object_unlock(Object* jmon) 
{ 
if( !lock_is_fat(jmon) Jí // W4 
lock_check_state(jmon) ; 


uint16* p_threadID = (uint16*) lock_word_addr (jmon) +1; 
// 被 自身 锁定 ， 检 查 递归 数 

uint8* p_recursion = (uint8*) lock_word_addr (jmon) +1; 
uint8* p_ contention = (uint16*) lock_word_addr (jmon) ; 


if( *p_recursion ){ 
recursion_dec(jmon) ; 

} else{ 
*p threadID = 0; // 释放 倘 
if( *p_contention ) { 


VM_Monitor* mon = lookup_monitor(jmon) ; 


monitor_lock(mon) ; 
monitor_notify (mon) ; 
monitor_unlock(mon) ; 


} 
}else{ // Ha 
VM_Monitor* mon = monitor_pointer(jmon) ; 


monitor_unlock (mon); 


void STDCALL vm_object_wait (Object* jmon, unsigned int ms) 


{ 
if( !lock_is_fat(jmon) ) { 
lock_check_state(jmon) ; 
VM_Monitor* mon = lookup_moniter(jmon) ; 
monitor_lock(mon) ; 
lock_inflate(jmon, mon); 


// 膨胀 后 移 除 
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monet meckern 
} 

VM_Monitor* mon = monitor_pointer(jmon) ; 
monitor_wait (mon, ms); 


} 


void STDCALL vm_object_notify (Object* jmon) 
{ 


if( !lock_is_fat(jmon) ){ 
lock_check_state(jmon) ; 
return; 


} 
VM_Monitor* mon = monitor_pointer (jmon) ; 
monitor_notify (mon) ; 


} 
这 个 设计 用 同一 个 monitor 数据 结构 支持 休眠 等 待 范 争 管理 和 锁 脱 胀 。 


18.4.2 ” 胖 锁 收缩 为 瘦 锁 


上 面 的 设计 看 起 来 很 优雅 , 但 并 不 支持 收缩 。 要 添加 收缩 支持 , 锁 拥 有 者 需要 确保 没有 在 胖 
锁 上 的 阻塞 线程 (由 于 monitorenter ) 或 者 等 待 线程 (由 于 object .wait () )。 然 后 它 就 可 
以 把 锁 字 转 回 到 瘦 锁 。 

1. 锁 收缩 条 件 

收缩 应 该 被 锁 的 拥有 者 在 解锁 它 的 胖 锁 时 执行 - 胖 锁 路 径 上 的 解锁 代码 在 收缩 锁 之 前 需要 检 
查 下 列 条 件 。 

(1) 这 个 胖 锁 上 没有 monitorentez 调用 引起 的 阻塞 线程 ， 即 vm_object_lock()。 

(2) 这 个 胖 锁 上 没有 在 这 个 锁 对 象 上 调用 object .wait () 引 起 的 等 待 线程 ， 即 vm_object_ 

wait()o 


(3) EXE BA BABA a at ak HB, E RECURSION_OVERFLOW. 


只 有 以 上 所 有 条 件 为 真 时 , 才能 收缩 这 个 锁 。 值得 注意 的 是 , 这些 条 件 如 何 能 被 其 他 线程 改 
变 ， 以 避免 在 锁 拥 有 者 的 检查 和 其 他 线程 的 修改 之 间 出 现 兖 态 条 件 。 


O 阻塞 线程 另外 一 个 线程 可 以 在 任何 时 候 调 用 monitorenter 并 被 阻塞 。 没 有 办 法 阻止 
其 发 生 ， 除 非 我 们 使 用 男 一 个 mutex 来 保护 这 个 monitor， 但 这 显然 和 设计 目的 是 冲突 
的 ， 因 为 那样 实际 上 就 变 成 了 monitor 的 monitor. 


因此 ， 即 使 在 收缩 线程 检查 这 个 条 件 (num blocked) 的 时 候 没 有 阻塞 线程 ， 也 可 能 有 
线程 就 在 检查 之 后 被 阻塞 。 所 以 检查 阻塞 线程 只 是 为 了 启发 式 的 目的 ， 而 不 是 为 了 确定 

性 。 为 了 支持 收缩 ， 我 们 当然 不 希望 被 收缩 的 锁 马 上 又 被 膨胀 ， 让 这 个 锁 就 在 膨胀 和 收 18 
缩 之 间 来 回 折腾 。 但 是 收缩 设计 必须 支持 存在 或 将 存在 休眠 线程 的 情况 。 
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O 等 待 线程 : 既然 收缩 线程 持 有 这 个 锁 ， 另 外 一 个 线程 就 不 可 能 同时 调用 Object .wait ()， 
因为 调用 object .wait () 需要 持 有 这 个 锁 。 


换 名 话说， 如果 我 们 在 vm_object_wait () 代 码 中 搬 桩 进 一 个 计数 器 ， 在 线程 等 待 前 后 
分 别 增 减 ， 那 么 这 个 计数 器 就 自然 而 然 地 被 这 个 锁 保 护 了 。 


收缩 线程 可 以 检查 这 个 计数 需 值 并 根据 检查 结果 行动 , 不 需要 关心 原子 化 问题 , 只 要 “ 检 
查 并 行动 ”在 它 释 放 锁 之 前 发 生 即 可 。 
注意 , 可 能 同时 有 些 线程 在 试图 获得 锁 以 调用 Object .wait () 。 这 些 线程 的 状态 与 上 面 
讨论 的 “阻塞 线程 ”是 一 样 的 。 
口 递归 数 : 如 果 递 归 数 溢出 ， 那 么 线程 不 能 收缩 它 的 锁 。 这 个 数字 完全 由 它 自 己 控制 ， 不 
会 出 现 竞 态 条 件 。 
综 上 ， 锁 收缩 设计 唯一 需要 考虑 的 情况 是 monitorenter 上 阻塞 线程 的 情况 。 
2. 锁 收 缩 设 计 
收缩 把 胖 锁 变 为 瘦 锁 。 在 这 个 过 程 中 , 可 能 有 一 些 线程 阻塞 在 胖 锁 上 ， 而 另 一 些 线程 阻塞 在 
瘦 锁 上 。 在 当前 的 设计 中 ， 瘦 锁 利用 胖 锁 monitor 进行 它 的 竞争 管理 。 这 意味 着 ， 一 个 线程 不 管 
是 阻塞 在 胖 锁 还 是 瘦 锁 上 ， 它 都 是 阻塞 在 同一 个 monitor 数据 结构 上 。 换 句 话说， 如 果 收 缩 不 释 
放 这 个 锁 , 那么 收缩 过 程 对 于 其 他 线程 根本 就 是 不 可 见 的 。 这 超级 整洁 。 这 可 以 归 因 为 胖 锁 和 兖 
争 管理 使 用 的 是 同一 个 monitor 数据 结构 。 


同时 ， 一 个 锁 被 收缩 后 ， 锁 拥有 者 仍然 持 有 这 个 monitor 数据 结构 上 的 锁 ， 这 时 候 它 还 是 作为 
针对 其 他 阻塞 线程 或 等 待 线程 保护 收缩 过 程 原子 性 的 控制 数据 结构 。 这 实际 上 是 膨胀 的 逆 过 程 。 
膨胀 过 程 也 被 控制 数据 结构 保护 ， 它 在 膨胀 之 前 被 锁定 。 那 么 膨胀 过 程 锁定 胖 锁 monitor 的 次 数 比 
瘦 锁 被 锁定 的 次 数 少 一 次 ， 因 为 在 膨胀 之 前 ， 这 个 monitor 已 经 作为 控制 数据 结构 被 锁定 了 一 次 。 
收缩 函数 很 简单 ,代码 如 下 所 示 。 它 在 瘦 锁 的 锁 字 中 重新 生成 胖 锁 状态 , 并 确保 胖 锁 monitor 
仍然 被 锁 住 一 次 。 
void lock_deflate(Object* jmon) 
VM_Monitor* mon = monitor_pointer(jmon) ; 
uint8* p_threadID = (uint16*) lock_word_addr(jmon) +1; 
uint8* p_recursion = (uint8*) lock_word_addr(jmon) +1; 


*p_recursion = mon->recursion; 


// 留 下 被 锁 住 一 次 的 胖 锁 (无 递归 ) 


mon->recursion = 0; 
// ERR 
*p_ threadID = (uint16)mon->owner->tid; 


} 


我 们 已 经 提 到 过 , 收缩 由 锁 的 拥有 者 在 解锁 它 的 胖 锁 时 执行 。 如 果 满 足 收缩 条 件 的 话 ， 锁 的 
拥有 者 首先 收缩 这 个 锁 ， 然 后 解锁 这 个 锁 。 既 然 现 在 这 个 锁 是 瘦 锁 ， 锁 的 拥有 者 应 该 解锁 这 个 瘦 
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锁 。 然 后 ， 最 终 它 也 解锁 胖 锁 monitor， 以 完成 整个 解锁 过 程 。 如 果 这 个 锁 被 收缩 了 ， 那 么 最 后 
这 个 步骤 解除 了 对 收缩 的 保护 (通过 解锁 控制 数据 结构 o 如 果 锁 没有 收缩 ， 那 么 最 后 这 个 步 又 
解锁 这 个 胖 锁 。 
基于 以 上 讨论 ， 解 锁 代 码 变 成 如 下 形式 。 
void STDCALL vm_object_unlock(Object* jmon) 
{ 
if( !lock_is_fat(jmon) ){ /7 RA 
osott (RAKE, w) 
} else{ // 胖 锁 
VM_Monitor* mon = monitor_pointer(jmon) ; 
lock_check_state(mon) ; 
if(!num_blocked && !num_waiting) { 
if( mon->recursion <= RECURSION_OVERFLOW ) { 
lock_deflate(jmon) ; 
object_unlock_thin(jmon) ; 
} 
} 
monitor_unlock (mon) ; 
} 
} 


如 果 锁 没有 递归 ， 解 锁 过 程 就 释放 了 这 个 瘦 锁 ,并 且 其 他 线程 可 能 立即 在 这 个 瘦 锁 上 操作 ， 
并 不 知道 可 能 有 一 些 线程 已 经 在 胖 锁 monitor 上 阻塞 了 。 

特别 是 在 锁 拥 有 者 解锁 瘦 锁 和 解锁 胖 锁 monitor 这 两 个 动作 之 间 ， 这 个 锁 不 能 被 其 他 线程 膨 
胀 ， 即 使 这 个 锁 作 为 瘦 锁 已 经 被 释放 。 

现 有 的 阻塞 线程 (ERE monitor 上 ) 或 新 的 阻塞 线程 (在 瘦 锁 控制 数据 结构 上 ) 只 能 在 收 
缩 线 程 解锁 胖 锁 之 后 才能 重新 开始 活动 。 

就 像 刚 刚 提 到 过 的 , 收缩 的 双 解 锁 过 程 是 膨胀 的 双 加 锁 的 逆 过 程 , 在 膨胀 中 线程 首先 取得 胖 
锁 ( 作为 控制 数据 结构 )， 然 后 取得 瘦 锁 并 膨胀 它 。 

3. 锁 收缩 支持 

我 们 应 该 追踪 等 待 线程 的 数量 , 最 好 还 有 阻塞 线程 的 数量 .为 了 记录 阻塞 和 等 竺 线程 的 数量 ， 
我 们 在 monitor 数据 结构 中 添加 了 两 个 计数 器 ， 并 把 它们 插 桩 进 胖 锁 的 锁定 和 等 待 代码 中 。 


struct VM_Monitor{ 
VM_Thread* owner; 
int recursion; 
Mutex* mutex; 
Condvar* condvar; 
int num_blocked; 
int num_waiting; 

} 


void monitor_lock(VM_Monitor* mon) 
{ 
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if( mon->owner == current_thread() ){ 
// 被 自身 锁定 
mon->recursion++; 

}else{ 
atomic_inc(mon->num_blocked) ; 
mutex_lock (mon->mutex) ; 
atomic_dec(mon->num_blocked) ; 
mon->owner = current_thread(); 


} 
void monitor wait (VM Monitor* mon, unsigned int ms) 


{ 
VM_Thread* self = current_thread(); 


if( mon->owner != self ) { 
vm_throw_exception("IllegalMonitorState") ; 
return; 


} 

self->status= THREAD_STATE_WAIT; 

// 利用 OS 条 件 超时 等 待 支持 

int temp_recursion = mon->recursion; 

mon->recursion = 0; 

atomic_inc(mon->num_waiting) ; 

bool signaled = cond_timed_wait (mon->condvar, mon->mutex, ms); 
atomic_dec(mon->num_waiting) ; 


// BR 
self->status= THREAD_STATE_RUNNING; 
mon->recursion = temp_recursion; 


if(self->interrupted) { 
self->interrupted = false; 
vm_throw_exception("Interrupted") ; 


} 


我 们 已 经 讨论 过 ，num_blockead 条 件 只 是 启发 式 的 。 当 它 为 零 时 ， 这 个 设计 不 能 保证 收缩 
发 生 时 没有 阻塞 线程 。num_waiting 条 件 是 强制 性 的 。 如 果 在 胖 锁 上 有 等 待 线程 的 话 ， 锁 不 能 
被 收缩 ， 因 为 这 个 设计 中 的 瘦 锁 不 支持 Object .wait ()。 


个 锁 的 最 初 设计 由 Onodera 和 Kawachiya 提出 。 他 们 把 它 称 为 Tasuki i, 但 这 里 的 推导 过 
Meerin 。 这 里 的 设计 开始 于 瘦 锁 中 的 竞争 标志 设置 问题 。 


同时 支持 膨胀 和 收缩 有 助 于 那些 只 出 现 零星 锁 苋 争 的 应 用 程序 . 为 了 避免 在 膨胀 和 收缩 之 间 
频繁 抖动 ， 需 要 基于 动态 特性 的 自 适 应 收缩 设计 。 


18.5 ”线程 局 部 锁 


到 目前 为 止 , 在 我 们 讨论 的 锁 实 现 中 , 除非 一 个 线程 已 经 拥有 这 个 锁 ， 和 否则 这 个 线程 总 是 需 
要 用 原子 指令 来 获取 所 有 权 。 这 是 基于 一 个 假设 , 即 一 个 空闲 锁 可 能 被 多 个 线程 竞争 。 如 果 这 个 
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假设 可 以 被 证 伪 , 那么 就 可 以 省 去 这 个 通常 很 昂贵 的 原子 操作 。 惰 性 锁 是 优化 思路 中 的 一 个 。 它 
只 适用 于 只 有 一 个 线程 有 锁 操 作 的 情况 。 

当 有 多 个 线程 使 用 锁 的 时 候 , 可 能 有 些 锁 对 象 只 被 单个 线程 访问 。 为 了 优化 这 些 锁 对 象 的 操 
作 ， 需 要 通过 技术 识别 出 这 些 锁 对 象 。 为 此 ， 常 用 的 技术 是 逃逸 分 析 和 和 逃逸 监测 。 

逃逸 分 析 利 用 编译 器 技术 分 析 一 个 对 象 的 访问 流 。 它 从 一 个 对 象 的 创建 点 开始 跟踪 它 的 访 
问 ， 直 到 它 的 引用 被 另外 一 个 线程 访问 〈( 即 逃逸 )， 或 者 变 得 无 用 了 (或 被 清空 )。 如 果 一 个 对 象 
被 识别 为 不 会 逃逸 ， 其 上 的 锁 操 作 就 可 以 被 优化 。 

逃逸 检测 动态 地 监测 一 个 对 象 在 运行 时 是 否 会 被 第 二 个 线程 访问 〈 即 逃逸 )。 它 通常 在 线程 
局 部 状态 分 配 一 个 对 象 ,利用 访问 屏障 捕获 任何 来 自 其 他 线程 的 访问 ,然后 把 对 象 标记 为 全 局 的 。 
就 像 惰性 锁 所 做 的 那样 ，VM 应 该 追踪 锁 操 作 ， 这 样 当 对 象 逃 逸 的 时 候 才 能 恢复 正确 的 锁 状 态 。 

当 一 个 对 象 逃 逸 时 ， 并 不 意味 着 这 个 对 象 上 的 锁 操 作 一 定 会 被 多 个 线程 执行 。 作 为 一 
monitor， 这 个 对 象 可 能 只 被 一 个 线程 锁定 /解锁 。 它 不 是 一 个 线程 局 部 对 象 ， 但 它 E ABER 
部 锁 。 

线程 局 部 锁 也 不 需要 原子 指令 。 基 于 对 象 访问 的 检测 在 这 里 不 起 作用 , 应 该 使 用 基于 锁 访 问 
的 检测 。 


18.5.1 HRPA 


VM 社区 开发 了 各 种 识别 线程 局 部 锁 的 技术 ， 比 如 Kawachiya 等 人 提出 的 锁 保留 ( Lock 
Reservation ), Hirt 和 Lagergren 提出 的 情 性 解锁 ( Lazy Unlocking )， 还 有 本 书 作者 提出 的 私有 锁 
(Private Lock ) 技术 。 

1. 锁 保 留 设 计 

所 有 这 些 设计 的 思路 在 概念 上 都 是 类 似 的 。 当 一 个 对 象 被 一 个 线程 锁 住 的 时 候 , 这 个 线程 变 
成 了 这 个 对 象 的 默认 拥有 者 ,在 它 解 锁 这 个 对 象 后 , 仍然 保留 着 所 有 权 。 我们 称 这 个 线程 是 这 个 
对 象 的 “ 锁 保 留 者 ”( lock reserver )。 之 后 同一 个 线程 ( 锁 保 留 者 ) 再 次 锁定 这 个 对 象 的 时 候 ， 
它 假定 这 个 锁 是 线程 局 部 的 ， 不 需要 原子 操作 锁 保 留 者 使 用 的 锁定 /解锁 序列 是 非 线 程 安全 的 。 

如 果 第 二 个 线程 试图 锁定 被 男 一 个 线程 保留 的 对 象 , 不 管 这 个 锁 当前 是 否 被 锁 着 , 第 二 个 线 
程 都 不 能 像 对 瘦 锁 或 胖 锁 那样 简单 地 锁定 3 Tae 因为 这 会 与 锁 保 留 ee ba 
冲突 。VM 在 允许 第 二 个 线程 锁定 它 之 前 ， 需 要 通过 某 种 方法 通知 锁 保 留 者 ， 开 始 使 用 线程 安 
的 代码 对 保留 的 锁 进 行 锁定 /解锁 。 

要 通知 锁 保留 者 它 对 这 个 锁 的 线程 局 部 性 的 假设 已 经 非 真 , 有 多 种 不 同 的 方法 。 一 个 常用 协 
以 是 第 二 个 线程 暂停 锁 保 留 者 ， ao 然后 恢复 这 个 线程 ， 它 就 不 再 是 
这 个 锁 的 保留 者 了 。 这 个 过 程 就 是 对 一 个 锁 “ 解 除 保留 ”。 
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这 个 线程 暂停 机 制 需要 确保 锁 保 留 者 的 暂停 点 不 在 锁定 /解锁 的 非 安 全 代码 范围 之 内 。 这 里 
可 以 利用 GC 安全 点 机 制 ， 以 保证 锁 保 留 者 只 在 安全 点 被 暂停 。 非 安全 代码 不 是 安全 点 ， 它 应 该 
被 快速 执行 完毕 ， 因 此 不 适合 暂停 。 


如 果 锁 保留 设计 使 用 类 似 于 瘦 锁 的 锁 字 ， 它 可 以 从 递归 字 节 中 拿 出 一 位 作为 “可 保留 位 ”， 
指示 锁 是 否 处 于 可 保留 模式 。 这 个 设计 只 在 膨胀 位 未 被 置 起 的 时 候 有 效 。 


当 可 保留 位 未 被 置 起 的 时 候 ， 像 平时 的 瘦 锁 一 样 使 用 这 个 锁 字 。 


如 果 可 保留 位 被 置 起 ,两 字 节 的 线程 ID (去掉 膨 胀 位 ) 用 作 锁 保留 者 的 ID。 如果 这 个 ID 有 
值 ， 就 意味 着 这 个 锁 被 这 个 ID 的 线程 所 保留 ， 而 不 是 像 在 瘦 锁 中 一 样 表示 已 被 锁定 。 可 保留 模 
式 并 不 意味 着 这 个 对 象 已 经 被 保留 。 


现在 用 递归 数 来 指示 锁定 状态 。 如 果 递 归 数 为 0， 这 个 锁 是 空闲 的 。 当 这 个 对 象 被 锁定 一 次 
时 ， 递 归 数 变 为 1。 当 递归 数 溢出 的 时 候 ， 这 个 锁 需 要 被 膨胀 。 


对 象 被 创建 的 时 候 ， 可 保留 位 是 置 起 的 ， 第 一 个 锁定 它 的 线程 自然 就 保留 了 它 。 它 会 用 自己 
的 ID 设置 线程 ID ， 并 将 递归 数 设置 为 1。 


胖 锁 也 可 以 有 保留 设计 。 可 保留 标志 可 以 放 在 monitor 数据 结构 中 。 
2. 锁 保 留 实现 
可 保留 瘦 锁 的 锁定 和 解锁 代码 类 似 如 下 : 


void STDCALL vm_object_lock(Object* jmon) 
{ 
if( is_reservable_mode(jmon) ) { 
if( reserved_by_self(jmon) ) { 
recursion_inc(jmon) ; 
return; 
}else if( lock_is_free(jmon) ) { 
// 竞争 锁 保 留 者 
bool result = lock_non_blocking(jmon) ; 
if( result ){ 
// 作为 保留 者 持 有 锁 
// 设置 递归 数 来 指示 它 已 被 锁定 
recursion_inc(jmon) ; 
return; 
} 
// 锁定 失败 ， 直 接 向 下 运行 到 解除 保留 部 分 
} 
// 锁 被 另 一 个 线程 保留 
lock_unreserve (jmon) ; 
} 
// 锁 未 被 保留 或 者 刚 在 前 面 被 解除 保留 
object_lock_normal (jmon) ; 


} 


void STDCALL vm_object_unlock(Object* jmon) 
{ 
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if( lock_is_reserved(jmon) ) { 
lock_check_state(jmon) ; 
recursion_dec(jmon) ; 
return; 
} 
// 锁 未 被 保留 
object_unlock_normal(jmon) ; 
} 
多 个 线程 可 能 同时 对 同一 个 锁 解 除 保 留 , 因此 解除 保留 锁 的 操作 需要 是 线程 安全 的 ， 比 如 像 
下 面 的 伪 代 码 这 样 : 
void lock_unreserve(Object* jmon) 
{ 
if( !is_reservable_mode(jmon) ) return; 
VM_Thread* reserver = lock_reserver( jmon ); 
vm_suspend_thread( reserver ); 
// 锁 保 留 者 在 安全 点 被 暂停 
int* p_lockword = lock_word_addr(jmon) ; 
int old_word = *p_lockword; 
if ( !reservable_bit_on(old_word) ) return; 
int new_word = normalize_lock_word(old_word) ; 
CompareExchange(p_lockword, old_word, new_word ); 
vm_resume_thread( reserver ); 
} 


当 第 二 个 线程 试图 解除 保留 一 个 锁 的 时 候 , 这 个 锁 可 能 是 被 持 有 的 , 也 可 能 是 空闲 的 。 即 使 
这 个 锁 是 空闲 的 , 解除 保留 过 程 仍 然 需 要 和 暂停 锁 保 留 者 , 以 防止 它 再 次 执行 ( 非 安全 ) 锁定 动作 。 

原子 操作 compareExchange 不 需要 检查 它 是 否 成 功 。 如 果 锁 保留 者 被 暂停 ， 只 有 这 一 行 代 
码 会 改变 锁 字 。 如 果 一 个 线程 失败 ， 那 么 必然 有 男 一 个 线程 成 功 。 

3. 锁 保留 竞争 管理 

显然 ， 当 一 个 可 保留 锁 被 锁定 的 时 候 , 它 的 状态 看 起 来 像 是 比 相 应 的 瘦 锁 多 锁定 了 一 次 。 换 
句 话说 ,在 保留 者 第 一 次 锁定 线程 局 部 锁 的 过 程 中 ,从 瘦 锁 的 角度 来 看 , 它 实 际 上 锁定 了 这 个 对 
象 两 次 : 一 次 是 持 有 这 个 锁 ， 另 一 次 是 增加 递归 数 。 之 后 当 保留 者 锁定 /解锁 同一 个 对 象 的 时 候 ， 
它 像 平常 的 瘦 锁 一 样 工 作 。 

上 述 事 实 导致 这 个 对 象 看 起 来 总 是 比 被 实际 锁定 次 数 多 锁定 了 一 次 。 即 使 在 这 个 对 象 被 保留 
者 释放 之 后 ， 从 瘦 锁 的 角度 来 看 ， 它 仍然 是 被 锁定 了 一 次 。 也 就 是 说 ,线程 ID 被 设置 了 ， 递 归 数 
为 0. 这 额外 的 一 次 锁定 帮助 锁 保 留 者 可 以 不 用 原子 指令 就 完成 锁定 /解锁 , 同时 防止 其 他 线程 锁定 
这 个 对 象 。 当 男 一 个 线程 想 要 锁定 这 个 对 象 的 时 候 , 它 需 要 通知 锁 保 留 者 多 解锁 这 个 对 象 一 次 。 这 
是 为 了 解除 对 这 个 锁 的 保留 。 通 过 这 种 方式 ， 锁 保留 者 释放 这 个 锁 之 后 ,这 个 锁 才 是 “真正 ”空闲 
的 。 显 然 ， 只 有 在 这 个 锁 “ 真 正 ” 空 闲 ， 没 有 被 保留 或 锁定 的 时 候 ， 其 他 线程 才能 获得 这 个 锁 。 

换 句 话说 , 锁 解 除 保 留 是 一 个 线程 竞争 修改 锁 字 的 过 程 。 锁定 瘦 锁 也 是 一 个 线程 竞争 修改 锁 
字 的 过 程 。 既 然 它 们 实际 上 是 类 似 的 过 程 ， 这 两 种 场景 下 就 有 可 能 使 用 同样 的 竞争 管理 。 
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在 之 前 的 设计 中 , 我 们 使 用 一 个 控制 数据 结构 来 管理 瘦 锁 上 的 线程 竞争 。 竞争 瘦 锁 的 线程 应 
该 首先 取得 与 瘦 锁 关联 的 控制 数据 结构 。 既 然 这 些 线程 需要 竞争 锁 解 除 保留 (在 它们 竞争 瘦 锁 之 
前 )， 那 么 使 用 同一 个 控制 数据 结构 来 管理 线程 对 锁 解 除 保留 的 竞争 是 合理 的 。 

就 像 对 Tasuki 锁 一 样 ， 我 们 可 以 为 此 使 用 胖 锁 monitor， 没 有 任何 问题 。 锁 解除 保留 的 伪 代 
人 码 给 出 如 下 : 


void lock_unreserve(Object* jmon) 
f 


VM_Monitor* mon = lookup_monitor(jmon) ; 
monitor_lock( mon ); 
if( !is_reservable_mode(jmon) ) { 
monitor_unlock( mon ); 
return; 
} 
VM_Thread* reserver = lock_reserver( jmon ); 


vm_suspend_thread( reserver ); 


// 锁 保 留 者 在 安全 点 被 暂停 


int* p_lockword = lock_word_addr (jmon); 

int old_word = *p_lockword; 

if ( !reservable_bit_on(old_word) ) { 
monitor_unlock( mon ); 
return; 

} 

int new_word = normalize_lock_word(old_word) ; 


*p lockword = new word; 
vm_resume_thread( reserver ); 
monitor_unlock( mon ); 

} 


使 用 这 个 monitor 来 管理 锁 解 除 保留 的 竞争 是 没有 问题 的 ， 原 因 如 下 。 

O 胖 锁 monitor 在 瘦 锁 变 为 胖 锁 之 前 纯粹 是 为 了 控制 目的 ， 而 锁 解 除 保留 通常 发 生 在 被 保留 
锁 变 为 普通 瘦 锁 之 前 。 

O 瘦 锁 有 可 能 在 男 一 个 线程 试图 解除 保留 它 之 前 膨胀 为 胖 锁 。 这 个 膨胀 发 生 在 线程 发 现 
锁 被 保留 之 后 ， 以 及 线程 了 开始 解除 保留 锁 之 前 。 然 后 这 个 控制 数据 结构 开始 变 为 胖 锁 。 


如 果 这 个 胖 锁 被 线程 S 持 有 ， 那 么 解除 保留 线程 T 在 试图 获取 胖 锁 的 时 候 会 被 阻塞 。 前 
文中 已 经 提 到 ， 锁 解除 保留 只 是 锁定 操作 的 一 个 前 奏 。 这 里 锁 解除 保留 引起 的 阻塞 和 锁 
定 胖 锁 引 起 的 阻塞 没有 本 质 上 的 区 别 。 

如 果 这 个 胖 锁 是 空闲 的 ， 那 么 解除 锁定 线程 T 就 取得 它 。 它 发 现 锁 已 经 被 解除 保留 ， 就 
会 释放 这 个 锁 。 之 后 ， 线 程 工会 进入 实际 的 锁定 序列 。 

O 在 锁 解 除 保留 线程 T 已 经 持 有 这 个 monitor 之 后 ， 瘦 锁 也 有 可 能 试图 膨胀 。 这 种 情况 下 ， 
锁 拥 有 者 S 不 能 膨胀 它 ， 因 为 膨胀 过 程 被 这 个 monitor 数 据 结构 保护 。 线 程 S 需要 在 这 个 
monitor 上 等 待 ， 直 到 线程 从 锁 解 除 保留 函数 返回 。 这 会 阻挡 锁 拥 有 者 一 小 段 时 间 。 它 
发 生 在 锁 保 留 者 由 于 递归 数 溢出 而 试图 膨胀 瘦 锁 的 情况 下 。 
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任何 情况 下 , 锁 膨 胀 和 锁 解 除 保留 的 过 程 都 是 顺序 化 的 。 如 果 我 们 想 要 让 有 翌 锁 也 支持 锁 保 留 ， 
这 个 顺序 化 的 性 质 是 有 意义 的 。 锁 解除 保留 可 以 在 锁 膨 胀 之 前 或 之 后 进行 , 但 永远 不 会 与 锁 膛 胀 
过 程 并 行 ， 因 为 锁 膨 胀 过程 中 的 锁 字 在 变换 之 中 。 因 此 ， 这 个 设计 是 一 致 的 : monitor 数据 结构 
用 于 管理 线程 对 锁 字 修改 的 范 争 。 

从 男 一 个 角度 看 ,概念 上 我 们 只 允许 可 以 获取 锁 的 线程 为 这 个 锁 解 除 保留 。 这 是 合理 的 ， 因 
为 解除 保留 最 终 是 为 了 锁定 这 个 锁 ， 

4. 关于 锁 保留 的 讨论 

这 两 个 设计 中 的 锁 解 除 保留 都 需要 暂停 锁 保留 者 , 这 通常 比 原子 指令 要 昂贵 一 个 或 更 多 数量 
级 。 因此, 鉴于 频繁 解除 保留 的 潜在 代价 , 这 两 个 设计 都 不 鼓励 让 同一 个 锁 以 后 再 次 变 为 可 保留 。 

一 个 解决 方案 是 采用 启发 式 方法 , 来 决定 何 时 把 一 个 对 象 转变 为 可 保留 模式 。 当 前 的 设计 在 
对 象 创建 的 时 候 设置 为 可 保留 模式 , 盲目 假定 所 有 对 象 都 有 线程 局 部 性 , 也 育 目 假定 了 它们 对 各 
自 的 创建 线程 是 线程 局 部 的 。 一 个 好 的 启发 式 算法 可 以 预测 一 个 锁具 有 线程 局 部 性 的 可 能 时 段 ， 
然后 只 在 这 个 时 段 足 够 长 的 情况 下 才 打 开 保 留 模 式 。 一 个 锁 的 线程 局 部 性 时 段 “ 足 够 长 ”意味 着 
在 第 二 个 线程 能 锁定 它 之 前 ,这 个 对 象 多 次 被 同一 个 线程 锁定 。 如 果 确 定 有 好 处 的 话 , 也 可 以 把 
一 个 普通 锁 恢复 为 可 保留 模式 

男 一 个 解决 方案 是 消除 锁 解除 保留 的 必要 性 。 之 所 以 需要 锁 解除 保留 ,是 因为 锁 保 留 者 以 非 
线程 安全 代码 修改 锁 字 。 但 根本 原因 是 所 有 线程 都 必须 修改 同一 个 锁 字 数据 来 进行 锁定 /解锁 。 
比如 ， 如 果 一 个 空闲 锁 被 一 个 锁 保 留 者 保留 ， 那 么 在 其 他 线程 的 眼中 ， 它 就 像 是 “已 被 锁定 "。 
锁 字 必须 被 修改 为 看 起 来 像 是 “ 空 亲 ”的 ， 然 后 其 他 线程 才能 锁定 它 。 


18.5.2 ”线程 亲密 锁 


为 了 消除 锁 解 除 保留 的 必要 性 ,“ 锁 保留 者 ”字段 不 应 该 指示 锁 是 否 被 持 有 ， 或 者 被 谁 锁定 
的 状态 。 为 此 ， 我 们 增加 两 个 新 字段 指示 锁定 状态 : 一 个 是 “保留 者 锁定 ”字段 (locked )， 
指示 这 个 锁 被 锁 保 留 者 持 有 ; 另 一 个 是 “其 他 锁定 ”字段 (clocked )， 指 示 锁 被 其 他 线程 持 有 。 
这 两 个 字段 总 是 一 起 操作 ,状态 相反 CARTE), 即 一 个 被 置 起 时 , 为 一 个 应 该 被 清除 。 这样“ 锁 
保留 者 ”字段 就 不 再 表示 这 个 锁 是 否 被 锁定 ， 也 就 不 需要 “解除 保留 ”操作 。 

1. 线程 亲密 锁 设 计 

使 用 这 两 个 独立 字段 ,我 们 可 以 在 这 个 字 上 用 原子 指令 CompareExchange 设置 “其 他 锁定 ” 
字段 ,这 个 字段 允许 所 有 非 保留 者 线程 安全 竞争 。 我 们 用 非 原子 的 设置 -检查 - 重 置 来 设置 “保留 
者 锁定 ”字段 , 这 个 字段 只 有 锁 保 留 者 可 以 访问 。 可 能 被 多 个 线程 访问 的 两 个 不 同 字 段 的 互 斥 性 ， 
用 访问 -检查 -访问 模式 加 一 个 原子 指令 来 维护 是 很 常见 的 。 

比如 ,在 “当前 副本 不 变 ” 移 动 算法 的 并 发 GC 设计 中 , 我 们 用 一 个 字段 作为 转发 位 来 指示 
一 个 对 象 是 否 在 转发 中 , 这 是 所 有 回收 器 线程 用 原子 指令 竞争 的 。 当 一 个 修改 融 想 要 访问 这 个 对 
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象 的 时 候 ， 它 可 以 使 用 读 - 检 查 -重读 ( read-check-reread ) 模式 来 确保 总 是 读 到 对 象 的 最 新 副本 ， 
或 者 用 写 - 检 查 - 重 写 ( write-check-rewrite ) 模式 确保 总 是 写 到 最 新 副本 ， 不 需要 原子 指令 。 


与 转发 位 设计 的 一 点 区 别 是 , 这 里 “其 他 锁定 ”字段 应 该 只 在 “保留 者 锁定 ”字段 未 置 起 ( 即 
值 为 0 ) 的 时 候 置 起 。 RS CompareExchange 把 这 个 两 个 字段 打包 到 同一 个 字 ， 可 
以 很 容易 地 实现 这 一 点 。 这 个 原子 指令 把 “保留 者 锁定 ”字段 放 到 它 的 比较 操作 数 中 。 

一 个 对 象 最 初 是 未 保留 的 。 第 一 个 锁定 它 的 线程 保留 它 。 一 旦 一 个 对 象 被 保留 ， 保 留 状 态 就 
不 会 改变 ， 保 留 者 也 不 会 改变 。 
基于 这 个 思路 ， 可 以 通过 下 面 的 伪 代 码 支 持 线程 局 部 锁 。 
// 为 了 便于 描述 ， 每 个 字段 使 用 一 个 字 节 


// 锁 字 布局 : xlocked - rlocked - me - reserver 


#define XLOCKED(a) ((int8)a<<24) “其 他 锁定 ”字段 
#define RLOCKED(a) ((int8)a<<16) “保留 者 锁定 ”字段 
#define RECURSION(a) ((int8)a<<8) - 锁 拥 有 者 的 递归 数 
#define RESERVER(a) ((int8)a) // 锁 保 留 者 ID 


bool lock_non_blocking(Object* jmon) 

{ 
uint8* p_word = (uint8*) lock_word_addr(jmon) ; 
uint8* p_xlocked = p_word + 3; 
uint8* p_rlocked = p word + 2; 
uint8* p_reserver = p_word; 
uint8 myID = (uint8) (current_thread()->tid); 
uint8 reserver = *p_reserver; 


if( reserver == 0){ 
// 还 未 被 保留 ， 竞 争 来 锁定 并 保留 它 
int newword = XLOCKED(0) | RLOCKED(myID) | RESERVER(myID) ; 
int oldword = CompareExchange(p_word, 0, newword) ; 
if( oldword == 0 ) return TRUE; 
return FALSE; 
}else if( reserver == myID ) { 
// 被 自身 保留 ， 检 查 它 是 否 被 持 有 
if( *p_rlocked == MyID ){ 
// MRO SHA 


return recursion_inc(jmon) ; 

// 锁 未 被 自身 持 有 ， 以 写 - 检 查 - 再 写 模式 

// 用 非 原子 操作 竞争 它 

*p_rlocked = myID; 

if( *p_xlocked ){ // 如 果 这 个 锁 被 其 他 线程 持 有 
*p_rlocked = 0; // 那么 我 放弃 
return FALSE; 

} 

return TRUE; // GU, RAET OC 

Jelse{ // 被 其 他 线程 保留 ， 写 p_xlocked 字段 

ifi *p_xlocked == myID J) 

// 被 自身 持 有 


return recursion_inc(jmon) ; 
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} 

// 未 被 自身 持 有 ， 用 原子 指令 竞争 它 

// 如 果 rlecked 字段 被 置 起 ， 这 个 原子 指令 会 失败 

If( *p_rlocked !=0 ) return FALSE; 

int newword XLOCKED(myID) | RLOCKED(0) | reserver; 


int tmpword = XLOCKED(0) | RLOCKED(0) | reserver; 
int oldword = CompareExchange(p_word, tmpword, newword ); 
return ( oldword == tmpword) ; 


} 


void lock_release(Object* jmon) 
{ 
uint8* p_word = (uint8*) lock_word_addr (jmon) ; 
uint8* p_xlocked = p_word + 3; 
uint8* p_rlocked = p_word + 2; 
uint8* p_recursion = p_word + 1; 
uint8* p_reserver = p_word; 
uint8 myID = (uint8) (current_thread()->tid); 


// 找到 正确 锁 拥 有 者 ID 
uint8* p_lockID; 


if( *p_reserver == myID ) { 
p_lockID = p_rlocked; 
else 


p_lockID = p_xlocked; 


if( *p_lockID != myID ){ 
vm_throw_exception("IllegalMonitorState") ; 
return; 


} 


if ( *p_recursion != 0 ) 
recursion_dec(jmon) ; 
else // 无 递归 ， 释 放 锁 
sp LOEk = Qp 


} 


在 这 个 锁 中 , 锁 保留 者 总 是 不 用 原子 指令 就 能 取得 锁 。 更 重要 的 是 , 锁 的 保留 不 会 妨碍 其 他 
线程 获得 锁 。 它 们 仍然 可 以 用 原子 指令 取得 锁 ， 不 需要 解除 保留 这 个 锁 。 

一 旦 一 个 锁 被 一 个 线程 保留 ， 它 就 永远 被 保留 。 如 果 在 应 用 程序 中 ,同一 个 对 象 被 多 个 线程 
锁定 , 但 它 大 部 分 时 间 被 其 中 一 个 线程 锁定 ,那么 这 对 应 用 程序 而 言 是 有 利 的 。 换 句 话 说 ,这 个 
锁 对 于 任何 线程 都 未 必 有 长 期 局 部 性 ,但 是 它 对 于 特定 线程 是 亲密 的 ,我 们 称 之 为 “线程 亲密 锁 ”。 

上 面 的 代码 只 给 出 了 非 阻 塞 路 径 。 增 加 阻塞 路 径 也 不 难 , 可 以 通过 使 用 线程 局 部 数据 结构 或 

注意 释放 锁 的 时 候 ， 当 前 锁 拥 有 者 只 需要 检查 它 自 己 的 锁定 状态 字段 。 有 可 能 在 某 个 短暂 的 
时 间 段 内 ， 两 个 锁定 状态 的 字段 ( 即 保留 者 锁定 字段 和 其 他 锁定 字段 ) 都 有 数据 。 当 一 个 非 保留 
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者 线程 取得 了 锁 ， 然后 很 快 又 释放 了 这 个 锁 时 ,这 就 会 发 生 。 与 此 同时 , 保留 者 试图 通过 写 它 的 
锁 状 态 字 段 获取 锁 ， 发 现 非 保留 者 字段 已 经 被 写 人 。 这 样 ， 两 个 锁 状 态 字 段 中 都 有 数据 。 现 在 当 
非 保留 者 释放 这 个 锁 的 时 候 , 它 可 能 看 到 保留 者 锁 状 态 字 段 还 没有 被 清除 , 所 以 它 只 需要 清除 自 


己 的 锁 状 态 字 段 。 图 18-5 展示 了 这 个 锁 字 的 状态 ， 其 中 保留 者 锁定 字段 被 置 起 ， 但 是 这 个 锁 并 没 
有 被 保留 者 持 有 。 


时 间 保留 者 线程 非 保留 者 线程 
| 锁定 : 

tmpword = 0-0-T1; 

compxchg (p, tmp, new) ; 






锁定 : 


*p_xlocked = 0; 





return FALSE; 


} 





“一 一 一 一 一 








图 18-5 MFA 


在 锁 保 留 者 清除 它 的 状态 字段 之 前 , 它 有 可 能 被 从 处 理 器 中 调度 出 去 。 在 非 保留 者 释放 这 个 
锁 之 后 ,保留 者 状态 字段 中 的 非 零 值 会 阻止 其 他 线程 获得 锁 ， 而 锁 保 留 者 并 没有 持 有 这 个 锁 。 这 
会 导致 所 有 线程 获取 锁 失 败 。 根 据 锁 的 设计 ， 失 败 的 线程 可 以 yield 等 待 这 个 锁 ， 也 可 以 休眠 等 
待 。 幸 运 的 是 , 不 可 能 所 有 的 竞争 线程 都 进入 休眠 。 锁 保留 者 必须 在 进入 阻塞 锁 的 慢 路 径 之 前 清 
除 它 的 锁 状 态 字段 ， 那 时 候 它 会 在 进入 休眠 之 前 再 次 检查 锁 状 态 ， 所 以 可 以 确保 过 程 向 前 推进 。 
Onodera 等 人 把 他 们 这 种 基于 Dekker 的 互 斥 算法 开发 的 设计 称 为 “ 非 对 称 spin lock”。 他 们 
用 这 个 设计 代替 了 Tasuki 锁 的 瘦 锁 , 不 需要 锁 解 除 保留 支持 就 得 到 了 线程 局 部 锁 的 好 处 。 接 下 来 
我 们 讨论 亲密 锁 的 膨胀 支持 。 感 兴趣 的 读者 可 以 阅读 他 们 的 论文 原文 。 
2. 线程 亲密 锁 的 膨胀 支持 
为 了 向 线程 亲密 锁 提 供 脱 胀 /收缩 支持 ， 有 几 点 需要 指出 。 
第 一 点 是 关于 锁 字 中 的 数据 字段 。 上 面 的 线程 亲密 锁 缺 少 两 个 Tasuki 锁 中 需要 的 标志 。 一 个 
是 竞争 标志 ， 男 一 个 是 膨胀 标志 。 想 要 获得 高 性 能 实现 ,就 需要 找到 一 个 高 效 的 方法 ,把 所 有 需 
要 的 信息 打包 到 对 象 关 中。 下 面 是 所 需 的 数据 项 。 
(1) 锁 保留 者 ID: 这 个 字段 代表 当前 锁 保 留 者 。 它 需要 放 在 锁 字 中 来 支持 原子 操作 。 在 上 面 
的 代码 中 , 这 个 字段 使 用 一 个 字 节 , 可 以 支持 最 多 127 个 线程 。( 0 表示 没有 被 保留 。) 可 
以 扩展 这 个 字段 以 支持 更 多 线程 。 
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(2) 锁 保 留 者 锁定 状态 ( 即 保留 者 锁定 字段 ): 这 个 字段 表示 锁 保 留 者 是 否 持 有 这 个 锁 。 它 需 
要 放 在 锁 字 中 来 支持 原子 操作 。 在 上 面 的 代码 中 ， 它 编码 了 与 锁 保 留 者 ID 同样 的 信息 。 
实际 上 为 了 避免 匈 余 信息 ， 它 只 需要 一 位 来 指示 锁 是 否 被 持 有 。 

(3) 其 他 线程 锁定 状态 ( 即 其 他 锁定 字段 ): 这 个 字段 表示 非 保留 者 锁 拥 有 者 ， 所 以 它 需 要 编 

码 一 个 线程 ID。 它 需要 放 在 锁 字 中 以 支持 原子 操作 。 

(4) 膨胀 标志 : 这 个 字段 可 以 是 单个 位 ， 用 来 指示 锁 字 是 否 为 一 个 monitor ID。 它 需要 放 在 
锁 字 中 ， 避 免 在 胖 锁 锁 字 上 的 原子 操作 成 功 。 它 确保 一 个 monitor ID 加 上 膨胀 标志 永远 
不 会 恰好 与 合法 线程 亲密 锁 字 有 相同 的 位 模式 。 

(5) 竞争 标志 : 这 个 字段 可 以 是 单个 位 ， 指 示 这 个 线程 亲密 锁 是 否 被 竞争 并 有 可 能 膨胀 。 它 
不 会 被 用 于 原子 操作 。 实 际 上 它 需 要 远离 前 面 四 个 字段 ， 因 为 竞争 线程 设置 竞争 标志 不 
应 该 干扰 那些 原子 操作 。 原 子 操作 是 为 了 竞争 ， 而 竞争 标志 是 为 竞争 失败 者 准备 的 。 

(6) 递归 数 : 这 个 字段 只 是 为 了 性 能 优化 ， 避 人 免 线程 亲密 锁 过 早 或 过 于 频繁 地 膨胀 。 它 不 是 
强制 性 的 ， 它 的 位 数 也 是 随机 应 变 的 。 它 不 需要 一 定 在 锁 字 中 ， 因 为 它 只 在 锁 被 持 有 时 
被 访问 ， 所 以 不 涉及 任何 竞争 。 

第 二 点 是 在 monitor 数据 结构 中 添加 锁 保 留 者 ID, 这 样 可 以 在 线程 亲密 锁 被 膨胀 的 时 候 持 有 
这 个 值 ， 并 在 锁 收缩 的 时 候 恢复 这 个 值 。 

最 后 一 点 是 ， 在 锁 脱 胀 和 收缩 过 程 中 ， 如 果 锁 被 锁 保留 者 持 有 ， 那 么 过 程 和 以 前 是 一 样 的 ， 
即 在 锁 字 中 与 膨胀 标志 一 起 设置 一 个 monitor ID, 

如 果 在 膨胀 /收缩 过 程 中 ， 锁 被 一 个 非 保留 者 线程 持 有 ， 那 么 这 个 过 程 需 要 关心 保留 者 锁定 
状态 。 正 如 之 前 提 到 的 ， 当 一 个 非 保留 者 持 有 锁 的 时 候 ， 持 有 者 锁定 字段 中 可 能 是 有 值 的 ， 这 是 
因为 锁 保 留 者 试图 获取 锁 的 时 候 总 是 无 条 件 地 设 定 这 个 字段 。 

非 保 留 者 可 能 在 保留 者 设置 保留 者 锁定 字段 之 前 取得 锁 。 然 后 在 保留 者 执行 下 一 步 , 也 就 是 
检查 其 他 锁定 字段 之 前 , 这 个 非 保留 者 可 能 膨胀 、 收 缩 、 甚 至 释放 这 个 锁 。 到 了 检查 操作 的 时 候 ， 
保留 者 可 能 发 现 其 他 锁定 字段 是 空 的 , 然后 获取 锁 并 返回 。 所 以 在 保留 者 锁定 字段 被 置 起 的 情况 
下 ， 非 保留 者 线程 上 的 膨胀 、 收 缩 和 释放 过 程 都 可 以 被 执行 。 不 管 保留 者 锁定 字段 是 否 被 置 起 ， 
其 中 的 值 应 该 在 这 个 过 程 中 保留 不 动 。 锁 保留 者 执行 膨胀 /收缩 就 没有 这 个 问题 ， 因 为 那 时 保留 
者 锁定 字段 在 它 的 控制 之 下 。 

为 了 支持 保留 者 无 条 件 设 定 保留 者 锁定 字段 ,即使 在 锁 已 经 被 膨胀 后 , 这 个 字段 也 需要 被 放 
入 锁 字 中 。 它 必须 与 monitor ID 以 及 膨胀 标志 放 在 一 起 。 如 果 我 们 用 锁 字 中 的 最 后 一 个 字 节 作为 
保留 者 锁定 字段 ，monitor ID 就 会 减少 为 3 字 节 ， 再 去 掉 作 为 膨胀 标志 的 最 高 位 。 

基于 上 述 讨 论 ， 非 保留 者 线程 膨胀 /收缩 锁 的 时 候 ， 它 不 能 像 锁 保留 者 那样 做 。 它 需要 用 原 
子 指令 确保 保留 者 锁定 字段 不 会 被 它 修改 。 接 下 来 是 使 用 新 monitor 数据 结构 定义 的 锁 膨 胀 /收缩 
的 伪 代 码 。 
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struct VM_Monitor{ 
VM_Thread* owner; 
int recursion; 
Mutex* mutex; 
Condvar* condvar; 
int num_blocked; 
int num_waiting; 
VM_Thread* reserver; 


void lock_inflate(Object* jmon, VM_Monitor* mon) 
{ 


uint8* p_word = (uint8*) lock_word_addr (jmon) ; 
uint8 recursion = lock_recursion(jmon) ; 

uint8 myID = (uint8) (current_thread()->tid); 
// 重新 产生 锁 状 态 

mon->recursion = recursion; 


mon->reserver = lock_reserver(jmon) ; 
if( myID == mon->reserver ){ // 被 自身 保留 
// 锁 保 留 者 不 需要 原子 操作 
*p word = (mon | INFLATION_FLAG) ; 
}else{ // 锁 拥 有 者 不 是 保留 者 
dot // 保持 保留 者 锁定 状态 
int tmpword = *p_word; 
int rlocked_state = tmpword & RLOCKED MASK; 
int newword = (mon | INFLATION FLAG | rlocked_state) 
int oldword = CompareExchange(p word, tmpword, newworld) ; 
}while( oldword != tmpword ); 
} 
// 重 置 竟 争 标志 为 FALSE 
lock_set_contention(jmon, FALSE) ; 
monitor_notify_all (mon); 


void lock_deflate(Object* jmon) 

{ 
VM_Monitor* mon = monitor_pointer(jmon) ; 
// 留 下 被 锁定 一 次 的 胖 锁 ( 即 无 递归 ) 
uint8 recursion = mon->recursion; 
mon->recursion = 0; 


// 转变 为 线程 亲密 锁 
uint8 myID = (uint8) (current_thread()->tid); 
uint8 reserver = (uint8) (mon->reserver->tid) ; 
uint rlocked_state; // 保留 者 锁定 状态 
uint xlocked_state; // 其 他 锁定 状态 
if( myID == reserver ){ // 锁 拥 有 者 是 保留 者 
rlocked_state = myID; 
xlocked_state = 0; s 
*p_ word = lockword_pack(xlocked_state, rlocked_state, 
recursion, reserver); 
Jelse{ // 锁 拥 有 者 不 是 保留 者 
dot // 保持 保留 者 锁定 字段 


int tmpword = *p word; 
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rlocked_state tmpword & RLOCKED_MASK; 
xlocked_state myID; 
int newword = lockword_pack(xlocked_state, rlocked_state, 
recursion, reserver); 
int oldword = CompareExchange(p_ word, tmpword, newworld) ; 
}while( oldword != tmpword ); 


} 
以 上 伪 代 码 像 之 前 一 样 用 线程 ID 作为 保留 者 锁定 状态 ， 但 使 用 一 个 位 也 可 以 。 
锁 实 现 仍然 有 改进 的 空间 。 与 垃圾 回收 一 样 ， 很 难 设 计 一 个 满足 所 有 应 用 程序 特性 的 算法 。 


基于 启发 式 的 改进 是 必要 的 , 否则 用 户 在 运行 他 们 的 应 用 程序 时 , 不 得 不 在 命令 行 中 指定 需要 的 
选项 。 
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到 目前 为 止 ， 我 们 的 讨论 都 关注 于 针对 传统 微 处 理 器 的 虚拟 机 ( VM ) 设计 。 微 体系 结构 的 
新 发 展 让 我 们 能 够 以 不 同 的 方式 设计 软件 。 硬件 事务 内 存 ( hardware transactional memory, HTM ) 
是 最 近 的 微 体 系 结构 创新 之 一 。 它 引发 了 VM 设计 领域 的 关注 ,是 因为 它 改变 了 线程 交互 的 方式 ， 
而 这 是 monitor 设计 的 核心 , 同时 对 垃圾 回收 需 的 设计 也 是 至 关 重 要 的 。 因 为 在 2014 年 本 书写 作 
的 时 候 ，HTM 对 于 社区 来 说 还 是 新 鲜 事 物 ， 所 以 本 章 的 讨论 只 是 为 了 头脑 风暴 。 


19.1 硬件 事务 内 存 


在 软件 开发 中 , 事务 处 理 是 用 于 维护 数据 完整 性 的 常用 技术 。 一 个 事务 中 的 操作 被 认为 是 一 
个 原子 单元 ,也 就 是 说 一 个 事务 的 所 有 结果 要 么 完全 被 提交 ,要 么 完全 没有 提交 。 中 间 结 果 对 于 
事务 外 部 是 不 可 见 的 。( 严格 来 讲 , 一 个 事务 不 一 定 是 一 个 原子 单元 。 这 里 我 们 就 不 深究 细节 了 ， 
因为 这 不 会 影响 我 们 的 讨论 。) 


19.1.1 从 事务 数据 库 到 事务 内 存 


在 处 理 线 程 间 数据 共享 的 时 候 ， 可 以 把 事务 的 概念 应 用 到 多 线程 编程 中 。 例 如 ， 同 一 个 锁 保 
护 的 多 个 临界 区 运行 实例 , 彼此 之 间 可 以 被 看 作 是 原子 的 。 这 个 特性 与 事务 类 似 。 如 果 系 统 可 以 
向 通用 多 线程 编程 提供 事务 支持 , 那 就 有 机 会 避免 编写 基于 锁 的 复杂 逻辑 , 或 者 还 可 以 提高 基于 
锁 的 代码 性 能 。 

基于 这 个 观察 结果 , 社区 已 经 开发 了 事务 性 编程 的 各 种 模式 或 解决 方案 , 目标 是 让 程序 员 可 
以 关注 于 高 性 能 设计 ， 把 复杂 的 正确 性 逻辑 留 给 事务 ， 这 样 就 能 同时 得 到 (1) 更 高 的 性 能 以 及 (2) 
更 好 的 可 编程 性 。 

与 数据 库 事务 不 同 , 通用 应 用 程序 的 大 部 分 执行 状态 都 在 内 存 中 维护 ,而 内 存 对 于 所 有 线程 
可 见 。 那 么 提交 执行 状态 就 意味 着 把 数据 写 入 内 存 层 级 体系 中 ,包括 与 内 存 数据 一 致 的 缓存 。 因 
此 ， 对 应 用 程序 提供 事务 支持 在 这 里 就 意味 着 提供 事务 内 存 (transactional memory ) 支持 。 也 就 
是 说 ,一 个 事务 中 的 所 有 内 存 写 或 者 全 部 提交 到 内 存 层级 体系 中 ,或 者 全 部 没有 。 
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这 种 事务 内 存 可 以 由 软件 、 硬 件 或 者 二 者 混合 实现 。 软 件 事务 内 存 ( software transactional 
memory, STM ) 在 传统 处 理 器 之 上 提供 事务 编程 API, HTM 在 处 理 器 级 提供 支持 ， 预 期 性 能 要 
远 远 高 于 STW, 

但 对 那 两 个 目标 ( 即 性 能 和 可 编程 性 ) 来 说 , 事务 内 存 不 太 可 能 得 到 比 通用 编程 模型 更 好 的 
可 编程 性 。 一 个 原因 是 ,对 于 程序 员 的 理解 来 说 , 事务 内 存 过 于 底层 。 这 个 问题 与 弱 序 内 存 一 致 
性 模型 类 似 ， 多 线程 程序 员 要 掌握 它 总 是 不 太 容易 的 。 

男 一 个 原因 是 , 被 事务 封装 的 一 段 代 码 与 无 事务 结构 的 同一 段 代 码 的 单线 程 操 作 语义 可 能 
不 一 致 。 例 如 ， 如 果 代 码 段 中 有 异常 ,那么 带 事 务 结构 的 和 不 带 事务 结构 的 单线 程 运行 结果 可 能 
有 所 不 同 。 与 之 相对 的 是 ,不 管 是 否 存在 单纯 支持 多 线程 运行 的 锁 结构 或 内 存 栅栏 ( 屏障 )， 单 
线程 程序 在 不 同 弱 序 内 存 模型 上 总 是 会 得 到 相同 的 结 

这 些 问题 所 导致 的 结果 就 是 , 把 事务 内 存 作 为 给 系统 软件 使 用 的 底层 机 制 更 为 合理 , 这 要 好 
于 把 它 作 为 一 个 通用 编程 模型 。 

向 普通 应 用 程序 开发 者 隐藏 事务 内 存 之 后 , 对 它 来 说 剩 下 的 目标 就 是 获得 比 基 于 锁 的 同步 更 
好 的 性 能 。 人 们 自然 会 去 研究 如 何 把 事务 内 存 应 用 于 VM 设计 , 并 保持 原来 的 语言 API 不 变 。 由 
于 STM 的 性 能 比 HTM 要 差 得 多 ， 我 们 对 STM 不 感 兴趣 。 


19.1.2 Intel 的 HTM 实现 


这 一 章 将 用 Intel 的 HTM 实现 来 展示 如 何 用 它 设 计 VM 中 的 线程 交互 ， 用 于 monitor 支持 和 
垃圾 回收 器 。 所 有 这 些 使 用 对 Java 开发 者 都 是 不 可 见 的 。 

Intel HTM ABI: Intel 处 理 器 的 HTM 实现 称 为 事务 性 同步 扩展 〈transactional synchronization 
extension, TSX )。 它 包括 受 限 事务 内 存 (restricted transactional memory, RTM ) 编程 接 

口 ， 提 供 了 几 个 可 以 用 于 编写 事务 的 新 指令 ， 特 别 是 XBEGIN 和 XEND 指令 ， 它 们 分 别 
表示 一 个 事务 区 域 的 开始 和 结束 。XBEGIN 指令 还 会 指定 一 个 回 退 处 理 器 。 这 个 代码 结 

构 用 汇编 语言 表示 如 下 。 

XBEGIN _fallback_handler 


. // 事务 性 区 域 
XEND 


_fallback_handler: 
7 // IRAE 


Intel 处 理 器 会 展 平 府 套 事务 。 不 管 哪 一 层 误 套 事务 中 止 ， 结 构 状 态 都 会 回 滚 到 最 外 层 。 
回 退 处 理 器 (fallback handler ): 当 事 务 由 于 数据 冲突 、 异 常 、LO 或 者 其 他 原因 中 止 时 ， 
处 理 器 状态 都 会 回 滚 到 事务 开始 时 的 状态 , 并 且 控 制 流 进 入 到 一 段 回 退 处 理 器 中 , 它 的 
地 址 由 XBEGIN 指令 给 出 。 回 退 处 理 器 可 以 决定 究竟 是 回去 重 试 这 个 事务 ,还 是 继续 走 
普通 非 事务 路 径 。 它 不 能 只 重 试 事务 ， 因 为 RTM 不 保证 一 个 事务 执行 最 终 会 被 提交 。 
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确保 能 够 最 终 推进 是 回 退 处 理 器 的 责任 。 

数据 冲突 (data confilict ): 为 了 支持 事务 性 运行 ， 在 事务 执行 过 程 中 ， 处 理 器 维护 了 一 
个 读 集 和 一 个 写 集 , 记录 事务 中 访问 的 所 有 内 存 位 置 。 这 些 集合 在 事务 开始 之 前 以 及 结 
果 提 交 之 后 是 空 的 。 传 统 上 ， 如 果 多 个 线程 访问 同一 个 内 存 位 置 ， 并 且 其 中 一 个 访问 是 
BER, 就 发 生 了 数据 竞争 ,现在 使 用 事务 的 时 候 ， 如 果 涉 及 数据 竞争 的 访问 之 一 来 自 
某 个 事务 ， 就 发 生 了 数据 冲突 。 

更 精确 地 说 , 当 一 个 事务 在 一 个 处 理 器 中 执行 的 时 候 ， 如 果 另 一 个 处 理 器 读 某 个 位 于 这 
个 事务 的 写 集 当 中 的 内 存 位 置 , 或 者 另 一 个 处 理 器 写 这 个 事务 的 读 集 或 写 集 当 中 的 某 个 
内 存 位 置 ， 就 会 发 生 数 据 冲 突 。 所 有 冲突 事务 都 会 中 止 。 数 据 冲 突 也 可 能 发 生 在 事务 和 
非 事务 执行 之 间 。 如 果 两 个 事务 没有 数据 冲突 ， 那 么 它们 可 以 并 行 执行 。 

事务 中 止 : 除了 数据 冲突 之 外 ， 一 个 事务 还 可 能 由 于 多 种 微 体 系 结构 原因 中 止 ， 下 面 是 
可 能 与 我 们 的 讨论 最 相关 的 几 个 例子 。 

第 一 个 原因 是 ,事务 中 的 缓冲 内 存 访问 量 超 过 了 一 个 逻辑 处 理 器 的 缓冲 容量 。 这 意味 着 
对 内 存 访问 集 来 说 ， 事 务 区 域 不 能 过 大 。 

第 二 个 原因 是 ， 这 个 事务 执行 一 个 无 法 在 本 地 缓冲 的 操作 ， 也 就 是 无 法 事务 化 地 执行 ， 
比如 IO 操作 、 异 常 以 及 系统 调用 。 

第 三 个 原因 是 ,在 事务 中 直接 调用 XABORT 指令 。 事 务 和 非 事务 之 间 的 线程 交互 需要 这 
个 指令 。 接 下 来 我 们 将 很 快 看 到 它 的 使 用 。 


19.2 使 用 HTM 的 monitor 实现 
用 HTM 实现 monitor 的 一 个 直观 思路 是 把 整个 同步 区 域 ( 方法 或 块 ) 看 作 一 个 事务 一 一 把 


字 节 码 monitorenter 看 作 XBEGIN， 把 monitorexit 看 作 XEND。 


例如 ， 当 JIT 4aPE A monitorenter 生成 代码 的 时 候 ， 它 就 只 生成 xpecin 指令 。 伪 代码 如 
下 所 示 。 


void STDCALL vm_object_lock(Object* jmon) 
{ 
_fallback_handler: 
XBEGIN _fallback_handler; 
} 


void STDCALL vm_object_unlock(Object* jmon) 
{ 

XEND; 
} 


注意 ， 我 们 仍然 使 用 带 _lock 和 _unlock 后 缀 的 、 和 以 前 相同 的 函数 名 ， 以 保持 命名 规范 
一 致 性 ， 尽 管事 务 可 能 与 实际 的 锁定 完全 不 相关 。 
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当 两 个 线程 同时 执行 事务 的 时 候 , 如 果 它 们 没有 数据 冲突 或 者 其 他 中 止 条 件 , 那么 两 个 线程 
都 可 以 成 功 完成 事务 。 这 意味 着 ,即使 这 两 个 同步 区 域 理应 锁定 同一 个 对 象 ， 如 果 它 们 用 事务 封 
污 的 话 ， 也 可 以 并 行 执行 。 换 名 话说, 同步 区 域 是 否 需 要 串 行 化 ,并 不 由 它们 是 否 使 用 同一 个 锁 
决定 , 而 是 在 运行 时 由 实际 的 正确 性 要 求 ( 即 是 否 有 数据 冲突 ) 决 定 。 这 是 使 用 事务 的 主要 动机 

不 笠 的 是 ,无 论 是 出 于 正确 性 还 是 性 能 方面 的 原因 ， 上 面 的 代码 都 无 法 实际 工作 ， 


19.2.1 基于 HTM 的 monitor 的 正确 性 问题 

关于 正确 性 , Intel 的 HTM 实现 不 保证 向 前 推进 。 一 个 事务 可 能 不 管 重 试 多 少 次 都 总 是 中 止 

例如 ,如 果 两 个 事务 在 同时 执行 时 有 数据 冲突 ,它们 可 能 都 回 深 并 重 试 , 然后 又 再 次 冲突 并 
中 目 。 这 种 情况 在 Java 应 用 程序 中 并 不 少见 。 

1. 回 退 处 理 器 的 问题 

回 退 处 理 需 应 该 决定 如 何 正 确 处 理 中 止 以 保证 回 前 推进 ,而 不 仅仅 是 重 试 事务 。 于 是 之 前 的 
伪 代 人 码 修订 如 下 : 

void STDCALL vm_object_lock(Object* jmon) 

XBEGIN _fallback_handler; 


return; 


_fallback_handler: 
object lock normal (jmon); 
} 


void STDCALL vm_object_unlock(Object* jmon) 
l if( object is locked(jmon) ){ 
lock_check_state(jmon); // 如 果 被 其 他 线程 锁定 ， 就 抛 出 异常 
object_unlock_normal (jmon) ; 
return; 
} 
XEND; 
} 
因为 XBEGIN/XEND 并 不 接触 对 象 头 来 操作 锁 字 ， 所 以 当 应 用 程序 执行 一 个 事务 的 时 候 ， 从 
对 象 头 的 角度 来 看 ， 它 是 没有 锁定 的 。 
上 面 的 代码 在 回 退 路 径 中 放 人 普通 锁定 过 程 ， 这 样 如 果 事 务 中 止 的 话 ， 可 以 用 基于 锁 的 
monitor 实现 重新 开始 同步 区 域 。 
同样 地 ， 当 锁 被 ( 自身 ) 持 有 的 时 候 ， 解锁 函数 使 用 普通 解锁 代码 。 如 果 在 解锁 函数 中 锁 是 
空闲 的 ， 那 就 意味 着 这 是 一 个 事务 执行 ， 因 此 只 需要 xEND 指令 。 可 以 使 用 指令 xTEST 测试 处 
理 右 当前 是 否 处 于 事务 执行 模式 中 。 
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2. 非 事 务 性 执行 的 问题 

这 个 代码 仍然 是 有 问题 的 。 既 然 有 两 类 同步 区 域 执行 (一 个 是 基于 事务 的 , 男 一 个 是 基于 锁 
的 )， 那么 有 可 能 第 一 个 线程 用 基于 锁 的 monitor ( 在 事务 中 止 后 ) 进入 它 的 同步 区 域 , 然后 第 二 
个 线程 使 用 基于 事务 的 monitor 进入 它 的 同步 区 域 。 

问题 是 , 这 种 情况 下 同步 区 域 的 数据 竞争 可 能 不 会 被 捕获 为 数据 冲突 , 因为 第 一 个 线程 可 能 
在 第 二 个 线程 事务 执行 之 前 或 者 之 后 访问 共享 内 存 位置 。 那 么 第 二 个 线程 会 认为 并 没有 数据 冲 
突 ， 然 后 就 成 功 提交 它 的 结果 。 

图 19-1 中 展示 了 这 个 出 错 条 件 ， 它 给 出 了 两 种 情况 作为 对 比 。 在 情况 1 中 ， 两 个 线程 都 在 
执行 事务 。 在 情况 2 中 ,一 个 线程 使 用 基于 锁 的 monitor， 男 一 个 使 用 事务 。 

情况 1: 两 个 线程 都 执行 事务 





开始 事务 1 
事务 化 地 写 入 L 
-添加 L 到 写 集 中 


一 开始 事务 2 
事务 化 地 从 L 开 始 读 


~ 数据 冲突 


两 个 事务 都 中 止 





= 省事 务 执行 


=> 事务 执行 


情况 2: 一 个 线程 执行 事务 ， 另 一 个 执行 非 事 务 
启动 非 事 务 


- 启动 事务 


事务 化 地 从 L 开 始 读 
-站 添加 L 到 读 集中 
没有 数据 冲突 





ge 非 事务 结束 
—p 非 事 务 执行 
=> 事务 执行 
图 19-1 使 用 事务 执行 和 不 使 用 事务 执行 的 同步 区 域 
图 19-1 中 ， 当 两 个 线程 都 作为 事务 执行 同步 区 域 时 ( 情况 1), 会 有 一 个 数据 冲突 。 如 果 第 
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一 个 线程 使 用 基于 锁 的 monitor， 它 没有 维护 读 / 写 集合 。 当 它 在 事务 执行 之 前 或 者 之 后 访问 共享 
内 存 位 置 的 时 候 ， 事务 无 法 检测 到 这 个 冲突 访问 (Hitt 2). 

3. 事务 中 的 冲突 检测 

为 了 捕获 基于 事务 和 基于 锁 的 同步 区 域 之 间 的 数据 冲突 , 我 们 需要 确保 事务 能 够 检测 到 锁 变 
量 ( 即 对 象 头 中 的 锁 字 ) 是 否 已 被 另 一 个 线程 锁 住 。 这 意味 着 执行 下 面 这 两 种 情况 。 

情况 1: 尽管 事务 代码 不 修改 锁 变量 ， 但 是 它 应 该 把 锁 变 量 添 加 到 事务 的 读 集中 ， 这 样 

就 可 以 检测 到 任何 其 他 处 理 器 对 它 的 修改 ， 并 中 止 这 个 事务 。 

这 确保 了 在 事务 期 间 的 任何 锁 获 取 都 能 够 被 检测 到 ， 如 图 19-2 所 示 。 

基于 事务 的 区 域 开始 

基于 锁 的 区 域 开始 


写 锁 字 
中 止 事务 





基于 锁 的 区 域 结束 


me 韭 事务 执行 
=> 事务 执行 
图 19-2 ”把 锁 字 添 加 到 事务 的 读 集中 
情况 2: 事务 应 该 在 事务 开始 时 检查 monitor 是 否 已 被 锁定 。 如 果 是 的 话 ， 这 个 事务 应 
该 被 串 行 化 ， 也 就 是 中 止 。 
这 确保 了 任何 在 事务 开始 之 前 获得 的 锁 都 可 以 被 检测 到 ， 如 图 19-3 所 示 。 


基于 锁 的 区 域 开 始 
写 锁 字 





基于 事务 的 区 域 开 始 


----- 检查 锁 字 是 否 被 写 人 
如 果 是 ， 中 止 


基于 锁 的 区 域 结束 


=p 疾 事 务 执行 


=> 事务 执行 
图 19-3 在 事务 中 检查 锁 字 是 否 被 写 人 
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情况 2 中 的 锁 检查 操作 自动 把 锁 变 量 添加 到 读 集中 ,所 以 这 个 操作 自然 就 满足 了 情况 1 的 
我 们 不 需要 担心 在 事务 完成 之 后 被 获取 的 锁 。 
新 添 了 这 些 锁 检查 操作 之 后 ， 伪 代码 的 变化 如 下 所 示 。 它 解决 了 正确 性 问题 。 


void STDCALL vm_object_lock(Object* jmon) 
{ 
XBEGIN _fallback_handler; 
if( object is locked(jmon) ){ 
XABORT; 
} 


revurn; 


_fallback_handler: 
object_lock_normal (jmon) ; 
} 


// 解锁 函数 保持 不 变 

这 个 设计 没有 提 及 支持 对 象 的 wait() 和 notify() 的 需求 。 把 传统 的 非 事务 实现 与 Intel 的 
HTM 一 起 使 用 没什么 问题 。Java 要 求 线程 在 调用 wait OFM notify () 之 前 持 有 monitor。 如 果 
事务 化 地 进入 monitor， 那 么 由 于 系统 调用 或 者 异常 ，wait () 和 notify () 中 的 传统 代码 会 导致 
事务 中 止 。 因 此 ， 使 用 传统 实现 没有 正确 性 问题 。 


19.2.2 基于 HTM 的 monitor 的 性 能 问题 


性 能 方面 有 更 多 需要 讨论 的 内 容 。Intel 处 理 器 上 的 当前 HTM 实现 开销 很 大 。 为 了 支持 事务 
执行 的 原子 化 ， 事 务 的 开销 可 能 要 比 原子 指令 的 开销 高 上 一 到 几 信 。 


1. 向 事务 引入 瘦 锁 


用 XBEGIN/XEND 对 代替 monitorenter/monitorexit 似乎 已 经 消除 了 执行 monitor 代码 的 
需要 。 它 可 能 比 瘦 锁 实现 要 慢 一 些 ， 瘦 锁 实 现 通 常 只 比 一 个 原子 指令 多 一 点 点 操作 。 


A 


即使 xBEGIN/xEND 的 成 本 不 比 一 个 原子 指令 高 ， 与 基于 锁 的 解决 方案 相 比 ， 潜 在 的 事务 中 
止 也 会 导致 额外 开销 。 事 务 中 止 要 求 恢 复 处 理 器 的 体系 结构 状态 , 这 可 能 比 原子 指令 要 昂贵 得 多 ， 
更 不 要 提 那 些 已 经 完全 浪费 掉 的 事务 操作 了 。 

如 果 瘦 锁 支 持 线程 局 部 锁 , 比如 锁 保 留 和 线程 亲密 锁 , 锁定 开销 甚至 会 更 小 。 由 于 这 个 事实 ， 
基于 事务 的 monitor 可 能 希望 像 之 前 一 样 使 用 瘦 锁 ， 只 用 事务 代 蔡 胖 锁 实现 。 伪 代码 如 下 所 示 。 

为 了 简洁 的 缘故 ， 与 我 们 在 第 18 章 中 给 出 的 实现 相 比 ， 这 段 代码 大 大 简化 了 逻辑 。 

void STDCALL vm_object_lock(Object* jmon) 

{ 

// A 


bool success = object_lock_thin(jmon) ; 
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if( success ) return; 


// EA ` 
XBEGIN _fallback_handler; 


if( object_is_locked_fat(jmon) ) { 
XABORT; 
} 


return; 


_fallback_handler: 
object_lock_fat (jmon) ; 
} 


// 解锁 函数 
void STDCALL vm_object_unlock(Object* jmon) 
了 
// RB 
if( object_is_locked_thin(jmon) ){ 
lock_check_state(jmon); // 如 果 被 其 他 线程 锁定 ， 就 抛 出 异常 


object_unlock_thin(jmon) ; 


return; 
} 
// WER 
if( object_is_locked_fat(jmon) ){ 
lock_check_state(jmon); // 如 果 被 其 他 线程 锁定 ， 就 抛 出 异常 
object_unlock_fat (jmon) ; 
return; 
} 
XEND; 


} 

上 面 的 实现 为 瘦 锁 的 时 候 没 有 使 用 事务 。 换 句 话 说 , 瘦 锁 总 是 串 行 执行 同步 区 域 。 因 为 瘦 锁 
的 预 设 就 是 这 个 锁 不 会 被 竞争 ， 所 以 没什么 问题 。 和 否则 ， 瘦 锁 会 膨胀 为 胖 锁 。 兖 争 的 意思 是 ， 当 
一 个 线程 持 有 这 个 锁 的 时 候 ， 另 一 个 线程 试图 获取 同一 个 锁 。 如 果 没 有 苋 争 ， 那么 瘦 锁 执行 本 喘 
就 是 串 行 的 ， 所 以 使 用 基于 事务 的 解决 方案 并 没有 好 处 。 

而 如 果 锁 被 竞争 的 话 , 基于 事务 的 解决 方案 能 展示 出 它 的 性 能 优势 如果 多 个 线程 并 行 执行 ， 
试图 获取 同一 个 锁 , 那么 基于 锁 的 解决 方案 会 串 行 化 它们 在 同步 区 域 的 执行 。 如 果 这 些 线程 的 同 
步 区域 没 有 任何 数据 访问 冲突 , 它们 可 以 作为 事务 被 并 行 执行 并 运行 成 功 。 这 也 是 我 们 选择 为 胖 
锁 使 用 事务 的 原因 ， 它 本 身 就 是 倾向 于 被 竞争 的 锁 。 

2. 重 试 事务 以 缓解 旅 鼠 效应 

当 事 务 真正 冲突 的 时 候 , 它们 会 中 止 并 回 退 到 胖 锁 路 径 。 问题 是 , 一旦 一 个 同步 区 域 进入 到 
胖 锁 路 径 ， 正 如 我 们 讨论 过 的 ,不 管 其 他 事务 有 没有 数据 冲突 ,为 了 正确 性 ,所 有 并 发 事务 都 需 
要 中 止 并 串 行 化 。 
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进一步 说 ， 当 所 有 同步 区 域 都 被 串 行 化 后 , 它们 还 会 导致 新 来 的 事务 中 止 , 直到 没有 基于 锁 
的 同步 区 域 在 执行 中 。 这 在 社区 中 被 称 为 旅 鼠 效应 (lemming effect )。 它 严重 降低 了 基于 事务 的 
解决 方案 的 性 能 。 为 了 缓解 这 个 问题 , 一 个 常用 实践 是 在 进入 胖 锁 路 径 之 前 重 试 中 止 的 事务 。 伪 
代码 给 出 如 下 。 


void STDCALL vm_object_lock(Object* jmon) 
{ 


// RR 
bool success = object_lock_thin(jmon) ; 
if( success ) return; 
// 胖 锁 
int retry cownt = 0; 
_RETRY: 


XBEGIN _fallback_handler; 

if( object_is_locked_fat(jmon) ) { 
XABORT; 

} 


return; 


_fallback_handler: 
retry_count += 1; 
if( retry_count < MAX RETRIES ){ 
goto _RETRY 
yelse{ 
object_lock_fat (jmon) ; 
} 
} 


// 解锁 水 数 保持 不 变 


事务 重 试 次 数 是 一 个 依赖 于 应 用 程序 特性 的 经 验 值 。 如 果 基 于 锁 的 同步 区 域 不 会 很 快 完成 ， 
重 试 事务 无 法 解决 这 个 问题 ， 因 为 很 容易 就 会 超过 重 试 浆 值 。 然 后 事务 回 退 到 胖 锁 ， 因 此 还 会 出 
现 旅 鼠 效应 。 在 锁 被 释放 之 前 重 试 事务 注定 还 是 会 中 止 。 一 个 改进 是 推迟 重 试 ， 直 到 锁 被 释放 ， 
如 以 下 伪 代 码 所 示 。 


void STDCALL vm_object_lock(Object* jmon) 
{ 


// BB 
bool success = object_lock_thin(jmon) ; 
if( success ) return; 
// 胖 锁 
int retry_count = 0; 
_RETRY: 
XBEGIN _fallback_handler; 
if( object_is_locked_fat(jmon) ){ ` 
XABORT; 


} 


return; 
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_fallback_handler: 
retry_count += + 1; 
if( retry_cownt < RETRY_THRESHOLD ) { 
// 等 待 锁 被 释放 再 重 试 
while( object_is_locked_fat(jmon) ) pause(); 
goto _RETRY 
selse{ 
object_lock_fat (jmon) ; 
} 
} 
// MA Sy BARA ASE 
重 试 之 前 等 待 ， 可 以 提高 事务 成 功 的 概率 。 在 任何 情况 下 ,这 都 比 不 等 待 的 连续 失败 事务 更 
好 ， 也 强 于 不 重 试 就 直接 在 monitor 上 休眠 。 
即使 与 胖 锁 相 比 , 基于 事务 的 解决 方案 也 并 不 是 总 有 益处 。 对 于 一 些 在 共享 数据 上 高 度 竞 争 的 
应 用 程序 来 说 , 事务 几乎 从 来 不 会 成 功 ， 因 此 使 用 事务 可 能 就 纯粹 是 一 个 损失 。 而 一 些 对 monitor 
性 能 不 敏感 的 应 用 程序 中 ,使 用 事务 也 可 能 显示 不 出 任何 可 见 的 区 别 。 
到 目前 为 止 ,这 个 设计 只 在 整个 同步 区 域 应 用 事务 概念 。 也 有 利用 事务 支持 的 其 他 设计 。 举 
例 来 说 , 事务 会 使 多 字 原 子 操作 更 简单 ,， 它 也 使 更 精巧 的 线程 局 部 锁 设 计 成 为 可 能 ， 比 如 切换 线 
程 亲密 锁 的 保留 者 。 
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垃圾 回收 (GC ) 设计 的 主要 任务 之 一 就 是 处 理 修改 器 和 回收 器 的 相互 干扰 。 只 要 存在 线程 
同步 的 情况 ，HTM 就 有 可 能 在 其 中 派 上 用 场 。 





19.3.1 GC 中 HTM 的 机 会 

一 个 同步 区 域 如 果 想 要 从 HTM 中 获 益 ， 需 要 具有 以 下 属性 。 

(1) 高 竞争 率 : 这 个 同步 区 域 引起 多 线程 间 大 量 的 串 行 化 执行 ， 并 且 很 难 通过 更 细 的 锁 粒 度 
消除 这 个 串 行 化 问题 。 如 果 用 事务 实现 的 话 ， 多 线程 可 以 并 行 执行 同一 个 区 域 ， 因 此 从 
HTM 中 获 益 。 

(2) 低 数 据 竞 争 率 : 并 行 执行 的 时 候 , 这 个 同步 区 域 应 该 具有 较 低 的 数据 竞争 率 。 如 果 用 HTM 
实现 它 的话 ， 由 于 数据 冲突 而 导致 的 事务 中 止 率 应 该 会 很 低 。 

(3) 足够 长 的 执行 时 间 : 事务 本 身 有 一 定 的 开销 。 只 有 在 同步 区 域 足够 大 的 时 候 这 个 开销 才 
能 得 到 补偿 。 和 否则 ， 基 于 锁 的 同步 区 域 可 能 比 事 务 更 有 效 。 

(4) 小 内 存 占 用 : 由 于 容量 溢出 而 导致 的 事务 中 止 应 该 较 低 。 

(5) 具有 非 事务 解决 方案 : 理论 上 说 ， 对 回 退 处 理 器 而 言 ， 非 事务 路 径 总 是 必要 的 ， 除 非 开 
发 者 绝对 确信 事务 总 会 最 终 提交 ， 从 而 总 是 能 够 最 终 推进 。 
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(6) 由 于 WO、 系统 调用 和 异常 等 其 他 因素 引起 的 中 止 率 较 低 。 

基于 上 述 这 些 条 件 ， 接 下 来 我 们 逐一 讨论 GC 设计 中 可 能 的 线程 交互 。 首 先是 对 象 分 配 。 

1. 对 象 分 配 

当 修改 器 需要 分 配 一 个 对 象 的 时 候 , CA GC 模块 得 到 这 个 服务 。 几 乎 所 有 VM 设计 都 是 
简单 地 让 修改 器 调用 GC 模块 中 的 一 个 函数 ， 不 需要 与 回收 器 交互 。 实 际 上 ， 如 果 是 移动 式 GC 
设计 的 话 ， 回 收 器 也 需要 分 配对 象 。 因 此 ， 分 配器 不 需要 是 专门 线程 。 分 配器 只 是 一 顶 帽 子 ,， 修 
改 器 和 回收 器 都 可 以 在 分 配对 象 的 时 候 戴 上 。 

然而 ， 分 配 需 在 分 配 新 对 象 的 时 候 可 能 会 竞争 堆 内 存 , 堆 内 存 是 在 线程 间 共 享 的 。 一 个 常用 
解决 方案 是 为 每 个 分 配器 使 用 线程 局 部 分 配 块 , 这 样 分 配器 只 需要 竞争 从 堆 中 抓 取 一 个 内 存 块 即 
可 ， 然 后 在 块 中 的 分 配 是 线程 局 部 的 。 

如 果 要 分 配 的 对 象 太 大 , 就 使 用 一 个 在 所 有 分 配器 之 间 共 享 的 全 局 空间 。 访问 这 个 全 局 空间 
需要 线程 同步 。 

分 配器 在 共享 空间 上 的 竞争 可 以 用 HTM 实现 ,锁定 这 个 空间 ,分配 一 个 块 (或 一 个 大 对 象 )， 
然后 解锁 这 个 空间 的 过 程 是 一 个 同步 区 域 。 这 里 可 以 使 用 与 前 一 节 中 相同 的 HTM 设计 。 但 它 不 
一 定 会 带 来 任何 好 处 ， 因 为 事务 可 能 太 短 了 。 

接 下 来 我 们 看 一 下 垃圾 回收 。 当 一 个 对 象 不 再 被 系统 引用 的 时 候 , 纯粹 的 引用 计数 GC 可 以 
实时 回收 这 个 对 象 。 和 分 配 操作 一 样 , 此 时 不 涉及 回收 器 。 更 新 引用 计数 需要 在 修改 器 之 间 同 步 ， 
但 是 这 个 同步 区 域 太 小 了 。 对 于 追踪 式 GC， 情 况 就 不 同 了 ， 需 要 以 下 任务 。 

2. 根 集 枚 举 

一 个 修改 器 的 根 集 可 以 由 它 自 己 枚 举 , 也 可 以 由 其 他 线程 枚 举 。 如 果 是 由 其 他 线程 枚 举 , 在 
活跃 操作 自己 的 执行 上 下 文 的 修改 器 与 需要 读 取 这 个 上 下 文 的 枚 举 线程 之 间 就 有 了 潜在 的 竞 态 
条 件 。 如 果 为 根 集 枚 举 暂 停 修改 器 ， 那 就 可 以 避免 这 个 竞 态 条 件 ， 否 则 就 需要 同步 来 协调 交互 。 
可 以 用 HTM 保护 栈 帧 ， 这 样 如 果 修 改 需 操作 这 些 这 些 帧 ， 那 么 对 它们 的 枚 举 就 会 中 止 。 

如 果 是 区 域 式 或 分 代 式 GC， 通 常用 写 屏 障 追 踪 跨 区 域 或 跨 代 引用 ， 也 就 是 作为 根 集 补 充 的 
记忆 集 。 这 个 操作 不 涉及 回收 器 。 线 程 同 步 可 能 发 生 在 一 个 全 局 池 中 维护 所 有 修改 器 的 根 集 和 / 
或 记忆 集 时 。 但 是 这 个 同步 区 域 太 小 了 ,无 法 从 HTM 中 获 益 。 

3. 活跃 对 象 标记 

如 果 是 停止 世界 (STW ) 并 行 标 记 ， 为 获得 负载 均衡 和 可 扩展 性 ， 回 收 顷 合作 标记 任务 。 通 
过 任务 池 共 享 , 所 有 的 标记 任务 都 放 在 一 个 全 局 任务 池 中 。 回收 器 存 取 一 个 任务 或 一 组 任务 的 时 
候 会 锁定 这 个 池 。 与 根 集 和 记忆 集 管理 类 似 ， 这 个 同步 区 域 太 小 了 。 另 外 ,任务 推送 技术 支持 无 
须 同步 的 并 行 活跃 对 象 标 记 。 

在 并 行 标 记过 程 中 ,多 个 回收 右 可 能 同时 到 达 同 一 个 对 象 ， 并 试图 标记 它 。 通 常 不 使 用 同步 
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也 没什么 问题 ， 因 为 可 以 把 对 象 标记 设计 为 寡 等 操作 ， 所 以 丢失 的 更 新 不 会 引起 任何 问题 。 

如 果 追 踪 过 程 是 并 发 的 ， 传 统 的 解决 方案 是 用 写 屏障 记忆 对 象 图 的 起 始 快照 (SATB ) 或 增 
量 更 新 (INC ) 对 象 图 来 匹配 当前 状态 。 它 不 需要 任何 显 式 线程 同步 。 实 际 上 写 屏障 试图 隐 式 地 
解决 修改 器 和 回收 器 之 间 的 竞争 ， 前 者 活跃 地 修改 对 象 图 ， 后 者 活跃 地 读 取 对 象 图 。 

可 以 像 写 屏障 一 样 使 用 HTM 来 解决 这 个 竞争 。 问 题 是 对 象 图 是 可 变 的 ， 很 难 预先 分 割 。 这 
意味 着 , 在 一 个 事务 中 不 管 回收 器 追踪 对 象 图 中 的 哪 一 部 分 , 修改 器 都 有 很 高 的 概率 会 写 图 中 的 
同一 部 分 。 换 句 话 说， 我 们 对 事务 的 成 功率 没有 信心 。 

读 屏 障 也 可 以 用 于 并 发 活跃 对 象 标记 。 也 就 是 说 ,不管 何 时 一 个 修改 器 访问 一 个 对 象 ， 修改 
器 都 标记 这 个 对 象 (如 果 它 还 没有 被 标记 的 话 )， 然 后 把 这 个 对 象 引用 压 人 标记 栈 用 于 扫 撒 。 扫 
描 可 以 由 修改 器 增 量 式 地 完成 , 也 可 以 由 回收 器 并 发 完成 。 在 这 个 设计 中 ， 回 收费 只 追踪 对 象 图 
中 还 没有 被 修改 器 访问 过 的 那 部 分 。 它 们 的 工作 是 补充 性 的 ， 而 不 是 竞争 性 的 ,因此 这 里 不 会 导 
致 大 量 的 同步 需求 。 

4. 死亡 对 象 回 收 

在 标记 清除 回收 中 ， 清 除 阶段 很 简单 ， 并 没有 涉及 很 多 线程 交互 ， 不管 是 STW 、 并 发 的 还 
是 推迟 的 。 

在 STW 移动 式 回收 中 ， 我 们 已 经 讨论 过 ， 对 象 移动 过 程 涉及 对 象 分 配 。 回 收 器 之 间 的 其 他 
并 行 操 作 也 很 容易 协调 。 

在 并 发 移动 式 回 收 中 ， 数 据 竞争 主要 出 现在 以 下 两 种 情况 中 : 

口 一 个 线程 复制 一 个 对 象 ， 同 时 其 他 线程 访问 同一 个 对 象 ; 

口 一 个 线程 更 新 对 一 个 对 象 的 堆 引 用 ， 同 时 其 他 线程 修改 这 些 堆 槽 位 。 

接 下 来 将 讨论 HTM 是 否 有 助 于 并 发 移动 式 回 收 。 


19.3.2 ”复制 式 回收 

在 并 发 复制 式 回收 的 过 程 中 ， 当 一 个 对 象 被 复制 的 时 候 ， 线 程 之 间 存 在 竞争 。 

1. 目标 空间 不 变 

如 果 GC 采用 “目标 空间 不 变 ” 并 发 复制 ， 对 一 个 对 象 而 言 ， 通 过 在 对 象 转发 过 程 中 锁定 这 
个 对 象 来 只 允许 一 个 线程 转发 它 , 或 者 是 修改 器 ,或 者 是 回收 器 。 在 复制 完成 之 前 ， 没 有 其 他 线 
程 能 够 访问 这 个 对 象 , 因为 任何 对 这 个 对 象 的 访问 或 者 只 能 在 这 个 对 象 被 复制 后 发 生 在 目标 空间 
中 ， 或 者 会 触发 对 象 复制 。 

对 象 转发 过 程 是 一 个 很 可 能 无 数据 竞争 的 同步 区 域 , 因为 直觉 上 多 个 线程 同一 时 间 访 问 同 一 
对 象 的 概率 就 不 会 很 高 。 因 此 ， 可 以 在 对 象 转发 例 程 中 使 用 HTM. 
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但 是 ,我 们 前 面 为 “目标 空间 不 变 ” 设 计 开 发 的 对 象 转发 代码 为 同步 区 域 使 用 了 单 对 象 锁 
( per-object lock )。 这 是 对 基于 对 象 复制 可 用 的 粒度 来 说 最 小 的 锁 。 这 意味 着 , 虽然 数据 元 争 率 很 
低 , 但 是 串 行 化 率 也 很 低 。 为 达到 高 并 发 性 ， 基 于 锁 的 解决 方案 已 经 足够 好 了 。 


2. 使 用 修改 器 事务 的 当前 副本 不 变 设计 


如 果 GC 使 用 “当前 副本 不 变 ” 并 发 复制 ,并 且 如 果 当 前 副本 在 源 空间 的 话 ， 那 么 修改 絮 访 
问 和 回收 顷 复 制 之 间 存 在 数据 竞争 。 


传统 的 设计 是 让 对 象 转发 、 读 取 、 写 和 操作 对 于 彼此 是 原子 化 的 。 举 例 来 说 ， 如 果 回 收 器 启 
动 了 一 次 复制 , 想 要 写 入 同一 个 对 象 的 修改 器 需要 等 待 复制 完成 , 然后 写 入 新 副本 。 或 者 反 过 来 ， 
在 修改 融 访 问 这 个 对 象 的 时 候 ， 回 收 顺 需要 放弃 复制 。 然 后 ， 或 者 回收 器 重 试 复制 ， 或 者 修改 珊 
需要 负责 转发 这 个 对 象 。 可 以 使 用 HTM 实现 这 个 原子 性 。 


如 果 修 改 器 的 对 象 访问 是 事务 化 的 ， 伪 代码 如 下 所 示 ， 以 对 象 写 为 例 。 与 之 前 为 “当前 副本 
ANE” GC 开发 的 代码 相 比 ， 做 了 修改 的 代码 用 加 粗 字 体 表示 。 

void write_barrier_current (Object* obj, int field, Value val) 
{ 

bool fld_is_ref = field_is_ref (field); 

// 只 向 field 写 入 当前 副本 地 址 

if(fld_is_ref && in_from_space(val) && is_forwarded(val) ) 

val = forwarding_pointer (val); 





if( !in_from_space(obj) ) { 
object_write(obj, field, val); 
Jelse{ // 对 象 在 源 空间 中 
_RETRY: 
if( !is_forwarded(obj) ){ 
XBEGIN _ RETRY 
if( under_forwarding(obj) ) 
XABORT; 
object_write(obj, field, val); 
XEND 
} 
// 对 象 已 被 转发 
obj = forwarding_pointer (obj); 
object_write(obj, field, val); 
} 
} 


上 面 的 代码 遵循 了 我 们 在 上 一 节 的 monitor 实现 中 开发 的 HTM 编程 原则 。 

它 并 没有 假定 回收 器 对 象 复制 是 事务 化 的 ， 而 是 假定 回收 器 用 对 象 头 指示 对 象 转发 状态 。 如 
果 这 个 对 象 还 没有 被 转发 , 就 开始 这 个 事务 。 这 段 代码 在 事务 一 开始 检查 这 个 对 象 是 否 已 经 在 转 
发 中 , 这 实际 上 把 这 个 对 象 头 放 入 这 个 事务 的 读 集 。 如 果 一 个 回收 器 试图 通过 设置 对 象 头 来 复制 
这 个 对 象 的 话 ， 修 改天 事务 就 会 中 止 。 

控制 流 从 被 中 止 的 事务 进入 重 试 路 径 。 如 果 这 个 对 象 正 在 转发 过 程 中 的 话 , 中 止 和 重 试 实际 
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上 就 一 起 形成 了 一 个 忙 等 循环 。 因 为 可 以 确定 回收 需 的 对 象 复 制 过 程 一 定 会 结束 , 所 以 重 试 最 终 
总 会 取得 进展 。 
在 这 个 设计 中 , 事务 只 用 于 源 空间 的 对 象 访问 , 因为 只 有 源 空间 的 写 入 与 对 象 复制 有 数据 竞 
争 关系 。 
3. 使 用 回收 器 事务 的 当前 副本 不 变 设计 
如 果 回 收 融 的 对 象 复制 是 事务 化 的 ， 伪 代码 看 起 来 就 像 下 面 的 函数 obj_forward_ 
transactional()。 之 前 为 并 发 复制 式 GC 开发 的 函数 obj_forward() 在 回 退 路 径 中 被 调用 。 
Object* obj_forward transactional (Object* obj) 
{ 
_RETRY: 
// 开始 复制 事务 
XBEGIN _fallback handler 
if( under_forwarding(obj) ) 
XABORT 
// 复制 对 象 到 新 地 址 
Object* new = obj_copy (obj); 
// 安装 转发 指针 
Obj_header header = obj_header (obj); 
header = new | FORWARD_BITS; 
obj_set_header (obj, header); 


XEND 
return new; 


_fallback_handler: 
retry_count += 1; 
if( retry count < RETRY THRESHOLD ) { 
goto _RETRY 
} 
return object_forward (obj); 


} 

上 面 的 代码 在 事务 一 开始 也 使 用 了 FORWARDING_BIT。 但 这 不 是 为 了 修改 器 对 象 访问 和 回 
收 絮 对 象 复制 事务 之 间 的 交互 ， 因 为 这 两 者 都 只 是 读 取 FORWARDING_BIT 位 ， 在 其 上 没有 数据 
冲突 。 回 收 器 对 象 复制 操作 把 整个 对 象 放 入 读 集 ,所 以 修改 器 对 这 个 对 象 任何 字段 的 写 操作 都 是 
数据 冲突 ， 会 中 止 回收 器 对 象 复制 ， 于 是 这 一 点 保证 了 交互 正确 性 。 

FORWARDING_BIT 是 为 了 保证 回收 器 事务 化 复制 和 回 退路 径 中 非 事 务 化 复制 之 间 的 交互 正 
确 性 。 非 事务 化 复制 在 对 象 复 制 过程 中 会 锁定 FORWARDING_BIT。 

4. 关于 事务 设计 的 讨论 

由 于 事务 的 高 开销 , 把 所 有 同步 区 域 都 实现 为 事务 并 不 是 一 个 好 主意 。 相 反 , 我 们 在 能 够 接 
受 中 止 和 几 次 重 试 的 时 候 可 以 使 用 事务 ， 而 在 更 关心 延迟 性 的 时 候 可 以 使 用 基于 锁 (或 基于 原子 
指令 ) 的 操作 。 当 执行 基于 锁 的 操作 时 ,并 发 的 基于 事务 的 操作 会 中 止 。 这 实际 上 是 给 了 基于 锁 
的 操作 更 高 优先 级 。 
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例如 , 在 并 发 复制 设计 中 , 最 好 使 用 事务 用 于 回收 器 复制 操作 ， 而 用 基于 锁 的 解决 方案 给 修 
改 顺 访问 更 高 的 优先 级 ， 以 此 得 到 更 好 的 修改 器 响应 性 ， 即 更 高 的 最 小 修改 顺利 用 率 ( MMU ) 

因为 在 一 般 的 应 用 程序 中 , 回收 器 和 修改 顺 访 问 同一 个 对 象 的 概率 通常 是 很 低 的 , 所 以 事务 
成 功率 就 会 很 高 。 但 是 传统 设计 使 用 细 粒 度 的 单 对 象 锁 用 于 同步 ,因此 修改 器 访问 和 回收 器 复制 
的 串 行 化 率 不 是 很 高 。HTM 解决 方案 的 收益 可 能 是 有 限 的 。 一 个 降低 事务 开销 的 方法 是 在 一 个 
事务 中 复制 多 个 对 象 。 


19.3.3 压缩 式 回 收 


正如 第 17 章 中 已 经 讨论 过 的 ， 复 制式 回收 可 以 用 单 趟 堆 操作 完成 活跃 对 象 标记 和 复制 ， 缺 
点 是 堆 空 间 的 低 利 用 率 , 还 可 能 有 较 低 的 数据 局 部 性 。 为 了 支持 滑动 和 看 似 “ 就 地 ”的 压缩 回收 ， 
在 独立 一 趟 中 完成 活跃 对 象 标记 是 合理 的 , 这 样 GC 可 以 一 个 区 域 接 一 个 区 域 地 回收 堆 以 获得 压 
缩 效 果 。 还 有 一 个 副产品 是 ，GC 可 以 选择 只 压缩 能 够 带 来 最 大 回收 吞吐 量 的 区 域 。 

1. 利用 HTM 的 思路 

一 旦 活跃 对 象 被 标记 ， 并 发 回收 器 就 还 有 两 个 剩余 任务 : 

(1) 对 象 移动 : 把 活跃 对 象 从 选中 的 源 区 域 移动 到 目标 区 域 ; 

D 引用 修正 : 把 堆 中 所 有 的 过 时 引用 更 新 到 被 引用 对 象 的 新 地 址 。 

这 两 个 任务 都 可 能 在 回收 器 和 修改 器 之 间 存 在 数据 竞争 。 在 对 象 移动 任务 中 , 修改 器 可 能 修 
改 回收 需 正 在 转发 的 同一 个 对 象 。 在 引用 修正 任务 中 , 修改 天 可 能 写 和 人 回收 占 试 图 更 新 的 同一 个 
引用 字段 。 并 发 压缩 式 GC 对 于 这 两 个 问题 都 有 解决 方案 ， 或 者 用 锁 ， 或 者 用 原子 指令 。 现 在 使 
用 HTM， 可 以 用 事务 来 处 理 这 些 潜 在 的 数据 竞争 。 

一 个 思路 是 把 对 一 个 对 象 的 这 两 个 任务 放 到 一 个 事务 中 , 也 就 是 转发 一 个 对 象 并 更 新 所 有 持 
有 这 个 对 象 过 时 引用 的 堆 槽 位 。 每 个 活跃 对 象 有 一 个 事务 。 概 念 上 说 ， 如 果 所 有 活跃 对 象 的 所 有 
事务 都 成 功 完成 ， 压 缩 回 收 就 结束 了 。 

如 果 与 修改 咒 有 数据 冲突 ,这 个 事务 就 中 止 。 如 果 修 改 器 写 和 人 源 区 域 的 同一 个 对 象 ， 或 者 修 
改 融 访问 一 个 堆 槽 位， 该 堆 槽 位 持 有 指向 源 区 域 中 的 这 个 对 象 的 引用 时 ， 就 会 发 生 数 据 冲 突 。 
Iyengar 等 人 在 Azul 的 C4 算 法 基础 上 ， 提 出 了 这 个 他 们 称 为 Collie 的 设计 。 

要 设计 一 个 事务 ,首先 要 了 解 事务 将 要 访问 的 内 存 位 置 , 也 就 是 读 集 和 写 集 。 在 对 象 移 动 和 
引用 修正 中 ,回收 器 读 取 源 区 域 中 的 对 象 ， 把 这 个 对 象 写 入 目 标 区 域 , 并 且 把 它 的 新 地 址 写 人 所 
有 持 有 其 旧地 址 的 堆 覃 位 。 这 个 事务 的 初始 伪 代 码 如 下 所 示 。 

_XBEGIN 

Object* new = obj_copy( obj ); 

Object** slot; 

for( each slot in remember-set (obj) ) { 

*slot = new; 


} 
_XEND 
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2. 找到 指向 一 个 对 象 的 所 有 堆 模 位 

为 了 找到 所 有 要 更 新 的 堆 槽 位 ， 回 收 需 应 该 在 活跃 对 象 标记 阶段 记忆 每 个 活跃 对 象 的 堆 覃 
位 。 也 就 是 说 ,每 个 活跃 对 象 都 有 一 个 关联 的 每 对 象 记忆 集 ， 其 中 包含 所 有 持 有 指向 它 的 引用 的 
堆 槽 位 ( 所 有 活路 对象 的 所 有 记忆 集 的 总 大 小 等 于 所 有 堆 引 用 槽 位 的 数量 , 因此 每 个 对 象 记忆 集 
的 平均 大 小 就 是 每 个 对 象 引 用 字段 的 平均 数量 ,通常 是 几 个 )。 

问题 是 这 个 每 对 象 记忆 集 在 运行 时 不 是 固定 的 。 它 在 修改 天 执行 过 程 中 可 能 发 生 以 下 几 种 改变 。 


第 1th, BUNA: 在 活跃 对 象 标 记 阶 段 之 后 ， 在 对 象 S 的 事务 执行 之 前 ， 记 忆 集 
槽 位 中 的 一 部 分 可 能 会 被 其 他 引用 值 履 盖 


这 不 是 一 个 大 问题 。 这 个 事务 可 以 在 更 新 之 前 检查 每 个 记忆 集 柳 位 。 如果 不是 指向 这 个 
事务 的 对 象 的 旧 引 用 ， 回收 器 就 跳 过 这 个 槽 位 ， 如 下 所 示 


_XBEGIN 
Object* new = obj_copy( obj ); 
Objiect** slot; 


for( each slot in remember-set (obj) ){ 
if( *slot != obj ) continue; 
*slot = new; 

} 

_XEND 


B 2th, WEZI: 在 记忆 集 之 外 ， 可 能 有 额外 的 堆 楼 位 持 有 指向 对 象 S 的 
引用 。 这 是 因为 修改 器 可 能 用 对 SS 的 引用 履 盖 一 些 堆 构 位 ， 或 者 创建 持 有 指向 S 的 引用 
的 新 对 象 。 


这 样 做 是 有 问题 的 ， 因 为 新 引用 楼 位 没有 记录 在 对 象 S 的 记忆 集中 。 对 象 $ 的 事务 或 者 
需要 使 用 最 近 更 新 的 记忆 集 ， 或 者 不 得 不 因 无 法 完成 使 命 而 放弃 。 
如 果 我 们 不 想 暂停 修改 器 的 话 , 实际 上 是 不 可 能 拥有 稳定 的 最 新 每 对 象 记忆 集 用 于 它 的 
事务 的 。 一 个 直接 的 解决 方案 是 走 放弃 路 径 ， 也 就 是 说 ， 用 写 屏 障 来 捕获 这 种 情况 ， 然 
后 通知 事务 放弃 。 
当 写 屏障 检测 到 对 一 个 对 象 的 引用 被 写 入 堆 中 时 ， 它 就 在 这 个 对 象 关中 设置 一 个 位 
NO_TRANSACTION 来 标记 这 种 情况 。 针 对 这 个 对 象 的 事务 会 读 取 这 一 位 ， 如 果 这 一 位 
被 置 起 的 话 就 中 止 。 下 面 给 出 修改 后 的 事务 代码 。 
_XBEGIN 
if( is_no_transaction(obj) ) 

XABORT 
Object* new = obj_copy( obj ); 
Objyect** slot; 
for( each slot in remember-set (obj) ){ 


if( *slot != obj ) continue; 
*slot = new; 


XEND 
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第 3 种, 事务 引起 的 记忆 集 改 变 : 如 果 被 转发 对 象 包含 指向 其 他 一 些 对 象 的 引用 ， 那 么 
移动 这 个 对 象 本 质 上 就 改变 了 这 些 对 象 的 记忆 集 , 因为 旧 副 本 中 原来 的 槽 位 现在 应 该 被 
替换 为 新 副本 中 的 槽 位 。 这 使 得 每 对 象 记 忆 集 由 于 事务 本 身 而 变 得 不 稳定 

幸运 的 是 ,不 像 修 改 器 的 行为 在 VM 的 控制 之 外 ， 回 收 器 的 行为 可 以 被 很 好 地 设计 。 比 
如 ,最 简单 的 设计 就 是 只 用 一 个 回收 器 ,这 样 所 有 事务 都 被 串 行 化 了 ， 回 收 器 对 记忆 集 
的 更 新 就 不 会 引起 数据 冲突 。 

第 4 种， 修改 器 执行 上 下 文中 的 横 位 : 为 了 正确 转发 一 个 对 象 ， 不 只 需要 更 新 记忆 集 ， 
修改 器 执行 上 下 文中 的 引用 也 应 该 被 更 新 。 

在 传统 并 发 移动 式 GC 设计 中 ， 需 要 一 个 翻转 阶段 来 更 新 执行 上 下 文中 的 那些 引用 。 如 
果 我 们 想 要 事务 不 用 翻转 阶段 来 完成 对 一 个 对 象 的 完整 移动 , 我 们 必须 放弃 被 执行 上 下 
文中 引用 指向 的 对 象 的 事务 。 

为 了 识别 从 执行 上 下 文 指 向 的 这 些 对 象 , 需要 一 个 接 一 个 地 暂停 修改 器 来 枚 举 运 行 中 根 
集 。 根 引用 指向 的 对 象 被 标记 为 NO_TRANSACTION。 这 个 过 程 称 为 一 个 检查 点 。 

在 检查 点 之 后 ,修改 器 读 取 的 任何 引用 值 ， 即 加 载 进入 执行 上 下 文 的 引用 值 ， 应 该 被 一 
个 读 屏 障 捕 获 。 这 个 读 屏 障 所 做 的 就 是 把 被 引用 对 象 标记 为 NO_TRANSACTION 

有 了 这 些 检查 点 和 读 屏 障 ， 所 有 修改 器 可 以 直接 访问 的 对 象 都 一 定 被 标记 为 
NO_TRANSACTION。 通过 这 种 方式 ， 上 面 的 写 屏 障 实际 上 不 再 被 严格 要 求 ， 因 为 被 写 入 
的 引用 或 者 来 自 执行 上 下 文 ,或 者 从 堆 中 加 载 。 前 者 可 以 被 检查 点 捕获 ,后 者 可 以 被 读 
屏障 捕获 。 在 任何 修改 器 被 恢复 之 前 ， 读 屏障 应 该 在 检查 点 处 被 打开 ， 这样 它 才 不 会 中 
i AEA Ao HK 9 5] JA o 

3. 处 理 潜 在 数据 冲突 

除了 记忆 和 集 稳定 性 问题 之 外 ， 还 有 两 种 可 能 的 数据 冲突 。 

第 1 种 ， 修 改 器 访问 〈 读 或 写 ) 记忆 集 模 位 : 当 修改 器 访问 一 个 持 有 指向 源 区 域 的 引用 
的 堆 槽 位 时 ,就 发 生 了 数据 冲突 ， 因 为 事务 会 写 入 记忆 集中 的 每 个 槽 位 来 修正 引用 ， 所 
以 任何 访问 记忆 集 楼 位 的 修改 器 都 会 中 止 这 个 事务 。 

问题 是 修改 器 访问 可 能 发 生 在 活跃 对 象 标记 阶段 之 后 以 及 事务 之 前 , 可 能 不 与 事务 执行 
冲突 。 应 该 用 读 / 写 屏障 捕获 它们 

如 果 访 问 是 用 引用 S 履 盖 引 用 了 的 修改 器 写 操 作 , 就 产生 了 指向 对 象 S 的 一 个 额外 堆 槽 
位 ， 以 及 对 象 工 记忆 集中 的 一 个 无 用 槽 位 。 前 面 已 经 描述 过 ， 这 个 写 操作 会 被 写 屏 障 捕 
获 ， 它 会 把 对 象 $ 标记 为 NO_TRANSACTION， 而 对 对 象 工 什么 也 不 做 。 

如 果 访 问 是 修改 器 在 一 个 记忆 集 构 位 上 的 读 操作 , 它 把 引用 S 加 载 到 这 个 修改 器 的 执行 
上 下 文中 ,事务 对 执行 上 下 文 是 不 可 能 更 新 的 。 因 此 ， 上 面 提 到 的 读 屏 障 需 要 捕获 这 个 
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读 操作 ， 并 把 对 象 S 标记 为 NO_TRANSACTION。 


第 2 种 ， 修 改 器 写 入 对 象 : 修改 器 写 入 对 象 时 会 发 生 数 据 冲突 。 如 果 写 操作 发 生 在 事务 
之 前 ， 从 事务 执行 的 角度 看 应 该 没有 问题 。 但 是 修改 器 要 写 入 这 个 对 象 ， 就 必须 持 有 指 
向 这 个 对 象 的 引用 。 前 面 已 经 提 到 , 这 已 经 把 这 个 对 象 从 事务 化 移动 中 排除 出 去 或 
者 通过 检查 点 ， 或 者 通过 读 屏 障 。 


如 果 对 象 有 一 个 字段 持 有 指向 自身 的 引用 ,作为 记忆 集 的 一 个 元 素 , 这 个 槽 位 应 该 在 事 
务 中 被 回收 器 更 新 。 这 不 是 一 个 数据 冲突 。 


下 面 的 伪 代 码 首 先 为 这 个 对 象 分 配 了 新 地 址 , 更 新 了 记忆 集 ,， 并 最 终 把 这 个 对 象 复制 到 
新 地 址 。 它 确保 对 象 中 的 自 指引 用 会 被 修正 。 


_XBEGIN 
if( is_no_transaction(obj) ) 
XABORT 
Object* new = obj_new_address( obj ); 
Object** slot; 





for( each slot in remember-set (obj) ){ 
if( *slot != obj ) continue; 
*slot = new; 


} 
mem_copy(obj, new); 
_XEND 


如 果 一 个 事务 成 功 完成 ， 系统 就 只 能 看 到 单个 新 副本 。 旧 副本 中 不 需要 转发 指针 ， 因 为 堆 中 
不 再 有 指向 这 个 旧 副 本 的 剩余 引用 。 如 果 一 个 事务 中 止 ， 系 统 中 就 只 有 旧 副 本 。 

不 能 被 事务 化 移动 的 对 象 是 被 检查 点 或 读 / 写 屏障 标记 为 NO_TRANSACTION 的 那些 对 象 。 应 
该 用 非 事 务 化 解决 方案 移动 它们 。 这 个 设计 可 以 选择 使 用 传统 并 发 压缩 算法 来 移动 这 些 标记 为 
NO_TRANSACTION 的 对 象 。 为 了 避免 复杂 化 ， 可 以 在 事务 化 移动 阶段 之 后 执行 非 事 务 化 移动 。 
这 里 我 们 不 再 深入 讨论 。 

这 里 的 研究 只 是 为 了 开阔 你 的 思路 ， 并 不 意味 着 基于 事务 的 设计 能 够 带 来 任何 实际 收益 。 


\ 
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